Теория Социальных Сетей.
Social Networks: Theory and Applications.

Зима-Весна 2014 / Winter-Spring 2014.

Тематический План Курса / Course Outline

  1. Введение в теорию социальных сетей / Introduction and examples of complex networks
  2. Степенные законы распределения / Power laws
  3. Модели формирования и роста сетей / Network formation
  4. Анализ структуры связей и роли узлов / Network structure and link analysis
  5. Сетевые сообщества / Network communities
  6. Диффузия и распространение эпидемий / Diffusion and epidimecs on networks
  7. Модели распространение влияния / Influence propagation
  8. Модели достижения консенсуса / Reaching consensus
  9. Информационные каскады / Information cascades
  10. Модель пространственной сегрегации / Spatial segregation models

Модуль 3 / Module 3

Лекции / Lectures

  1. [13.01.2014] Комплексные сети / Complex networks. [Lecture 1] [Audio ]
    Введение в теорию комплексных систем. Основные понятия в теории сетей. Свойства и метрики анализа сетей.
    Introduction to the complex network theory. Network properties and metrics.
  2. [20.01.2014] Степенные законы распределения / Power laws. [Lecture 2] [Video]
    Степенное распределение. Масштабно-инвариантные сети (scale-free networks). Распределение Парето, нормализация, моменты. Закон Ципфа.Граф ранк-частота.
    Power law distribution. Scale-free networks.Pareto distribution, noramlization, moments. Zipf law. Rank-frequency plot.
  3. [27.01.2014] Случайные графы / Random graphs. [Lecture 3] [Video]
    Модель Erdos-Renyi. Распределение Бернулли и Пуассона. Функция распределния степеней. Фазовые переходы, возникновение связанной компоненты. Диаметр и кластерный коэффициент. Конфигурационная модель
    Erdos-Reni random graph model. Poisson and Bernulli distributions. Distribution of node degrees. Phase transition, gigantic connected component. Diameter and cluster coefficient. Configuration model
  4. [03.02.2014] Малый мир и динамические модели роста / Small world and dynamical growth models. [Lecture 4] [Video]
    Модель Barabasi-Albert. Предпочтительное присоединение. Уравнение в непрерывном приближении. Временная эволюция степеней узлов. Распределение степеней узлов. Средняя длина пути и кластерный коэффициент. Модели "малого мира". Модель Watts-Strogats. Однопараметрическая модель. Переход от регулярного графа к случайному. Измения кластерного коэффициента и средней длины пути.
    Barabasi-Albert model. Preferential attachement. Equation in continues approximation. Time evolition of node degrees. Node degree distribution. Average path length and clustering coefficient. Small world model. Watts-Strogats model. Transition from ragular to random. changes in clustering coefficient and ave path lenght.
  5. [10.02.2014] Метрики центральности узлов и анализ связей /Nodes and Links analysis. [Lecture 5 ]
    Понятия центральности и престижа. Модельные графы. Degree centrality, closeness centrality, betweenness centrality, статус/rank prestige (eigenvector centrality). Центральность сети (сentralization). Алгоритм PageRank. Стохастические матрицы. Теорема Perrona-Frobenius. Степенные итерации. Нахождение собственного вектора. Hubs и Authorities. Алгоритм HITS. Сравнение ранжировок. Расстояние Kendall-Tau.
    Node centrality metrics, degree centrality, closeness centrality, betweenness centrality, eigenvector centrality. Graph strucure based metrics. PageRank, stochastic metric and Perron=Frobenius theorem. Power iterations. Hubs and Authorites. HITS algorithm. Kendall-Tau ranking distance.
  6. [17.02.2014] Структурная эквивалентность / Structural equivalence. [Lecture 6]
  7. Метрики структурной эквивалентности узлов. Эвклидово расстояние. Расстояни Хэмминга. Корреляционный коэффициент. Сходство по косинусу. Ассортативнoe смешивание. Модулярность. Ассортативный коэффициент. Смешивание по степеням узлов.
    Structural equivalency metrics. Eucleadean and Hamming distance. Correlation coefficient. Cosine similarity.Assortative mixing and homophily. Modularity. Mixing by degree.
  8. [24.02.2014] Сетевые сообщества / Network communitites [Lecture 7] [Video]
    Понятие сетевых сообществ Плотность связей. Метрики. Разделение графа на части. Разрезы в графе. Минимальный разрез, нормированные разрез.Агломеративные и разделяющие алгоритмы. Корреляционная матрица. Кластеризация. Понятие промежуточности ребер. Алгортмы Ньюмана Гирвина. Спектральные методы. Оптиизация модулярности. Классификация алгоритмов нахождения сообществ.
    Network communities. Graph density. Graph pertitioning. Min-cut, quotent and normalized cuts metrics. Divisive and agglomerative algorithms. Repeated bisection. Correlation matrix. Clustering. Edge Betweenness. Newman-Girvin algorithm. Spectral methods. Modularity maximization algorithm (Newman)
  9. [03.03.2014] Алгоритмы разбиения графов / Graph partitioning algorithms [Lecture 8] [Video]
    Приблииженные алгорирмы. Задача нахождения минимально разреза в графе. Алгорим randomized min-cut. Многоуровневый подход. Нахождение сообществ многоурвневым методом. Локальная кластеризация. Понятие проводимости, алгоритм Nibble
    Approximation algorithms. Randomized min-cut (Karges's algorithm). Probability of finding min-cut. Multilevel paradigm. Multilevel algorithm for power law graphs. Local clustering. Conductance. Nibble Algorithms.
  10. [10.03.2014] Сетевые структуры / Network structures [Lecture 9] [Video]
    Понятие к-ядра графа, диады и триады в графах, мотивы.
    Graph motiffs, k-cores, diad and triad census
  11. [17.03.2014] Специальные типы сетей / Special classes of networks [Lecture 10] [ Video]
    Двудольные графы и сети аффилированости. Сети с положительными и отрицательными связями
    Bi-partite graphs and affiliation networks. Networks with signed edges
  12. [24.03.2014] Зачет

Домашние задания / Homeworks

  1. [27.01.2014, due: 03.02.2014]
    1. Построить кумулятивную функцию распределения (rank-frequency plot) для частот с которыми встречаются слова в корпусе английского языка wordcounts. Проверить выполнение закона Ципфа. Найти показатель степенной функции alpha и среднее квадратичное отклонение sigma. Указать минимальную, максимальную, среднюю частоту и медиану.
    2. Построить распредение и кумулятивную функцию распределения степеней узлов в следующих сетях (входящих и выходящих степеней узлов) в следующих сетях:
    а) Фрагмент сети интернет раутинга network
    b) Фрагмент веб графа web graph
    c) Фрагмент Facebook facebook
    3. Являеются ли полученные рапсределения степенными? Найти минимальное, максимальное и среднее значение степени узлов k (k_in, k_out). Вычислить alpha и sigma используя метод ML максимального правдоподобия и найти оптимальные значения x_min используя тест Колмогорова-Смирнова.
  2. [03.02.2014, due: 17.02.2014]
    1. Написать процедуру генерации случайных графов в модели Erdos-Renyi G(n,p).
    2. Написать процедуру моделирующую процесс предпочтительного присоединения (модель B-A).
    3. Используя полученные генераторы провести следующие исследования:
    а) найти и изобразить распределение степеней узлов, мин, мах, медиану, среднюю степень.
    в) Визуализировать полученные сети
    с) Для BA модели найти степенной показатель alpha и величину sigma, для ER модели вычислить среднее и ср. ква отклонение.
    d) В полученных графах найти и изобразить на графике кластерный коэффициент и среднюю длину пути как функицю от числа узлов графа N (p > p_c для ER)
    4. В модели ER провести численные эксперименты и найти момент возникновения гигантской связанной компоненты (critical value of p). Найти и графически изобразить зависимость среднего размера самой большой компоненты графа от параметра p
  3. [17.02.2014, due: 03.03.2014]
    1. Имплементировать нормализованные метрики центральности узлов: степенная (degree centrality), близостная (closeness centrality), промежуточная (betweenness centrality). Используя полученные функиции рассчитать и графически сравнить значение метрик узов для сетей a) karate club b) political books c) political blogs
    2. Имплементировать алгоритмы PageRank и Hits (Hubs & Authorities) Рассчитать и сравнить значения Degree Centrality, PageRank и Hits для сетей а) web1 б) web2 Какие из веб страниц имеют наибольшие значения Degreee Centrality, PageRank и Hubs-Authorities score? 3. Отранжировать узлы по метрикам и сравнить ранжированные списки узлов расстоянием Kendall tau. Сравнение произвести для топ 10,100,1000 узлов.
  4. [03.03.2014, due: 21.03.2014]
    1. Имплементировать любые два из трех алгоритмов для нахождения сообществ: Edge betweenness, Spectral modularity, Nibble (random walk). Используя написанные алгоритмы, найти сообщества в сетях a) karate_club b) dolphins c) political_blogs
    2. Сравнить найденные сообщества используя три метрики: модулярность, плотность, conductance.
    3. Визуализировать указанные сети и обозaнчить цветом узлы принадлежащие разным сообществам.

Материал к лекциям / Reading material

Модуль 4 / Module 4

Лекции / Lectures

  1. [31.03.2014] Диффузия в сетях / Diffusion on networks [Lecture 1] [Video]
    Процесс физической диффузии. Уравнение диффузии. Диффузия на сетях. Дискретный оператор Лапласа, Матрица Лапласа, решение уравнения диффузии на графе. Случайные блуждания на графе.
    Physical diffusion. Diffusion equation. Diffusion on netowrks. Discrete Laplace operator, Lapalce matrix. Solution of the diffusion equation. Random walks on graph.
  2. [07.04.2014] Распространение эпидемий / Epidemics [Lecture 2] [Video]
    Модели SI, SIR, SIS. Решения диф. уравнений. Предельные случаи.
    Epidmic models SI, SIS, SIR. Solution of diff. equations. Limiting cases.
  3. [14.04.2014] Эпидемии в сетях / Epidemics on networks [Lecture 3] [Video]
    Модели SI, SIR, SIS на сетях. Моделирование распростронения.
    Epidmic models SI, SIS, SIR. Modeling of infectino propagation
  4. [21.04.2014] Пороговые модели влияния /Threshold models and Influence maximization [Lecture 4] [Video]
    Распространение вляния. Пороговые модели принятия решений.Модель Гранноветера. Определение наиболее влиятельных узлов.
    Social diffusion.Granovetter's Threshold model of Collective behavior. Most influential nodes in networks.
  5. [28.04.2014] Распространение идей / Social contagion [Lecture 5] [Video]
    Распростанение идей. Модель каскадов. Размеры касакдов
    Cascades in networks. Basic cascade model. Cascade capacity.
  6. [12.05.2014] Информaционные каскады / Information cascades [Lecture 6] [Video]
    Наблюдательное обучение. Информационные каскады. Условия воникновения каскадов
    Observational learning. Information cascades.
  7. [19.05.2014] Достижение консенсуса / Reaching consenus [Lecture 7]
    Обучение в сети. Модель Де Грута. Условия достижимости консенсуса. Социальное влияние
    Social learning. De Groot model. Reaching consensus
  8. [02.06.2014] Стратегические модели формирования сетей / Strategic models of network formation[Lecture 8]
    Функия полезности. Эффективность и стабильность. Модель связей. Модель со-авторов.
    Stratigic model. Utilities. Stability and efficiency. Distance based utility, co-author models.
  9. [09.06.2014] Модели пространственная сегрегация / Spatial segregation model [Lecture 9] [Video]
    Пространственная сегрегация. Модель Шиллинга. Моделирование с помощью агентов
    Schelling's segregation model. Spatial segregation. Agent based modelling.
  10. [23.06.2014] Экзамен / Exam

Проекты / Projects

  1. Моделирование распространение эпидемии в сетях . Имплементировать SIS/SIR модели распространения эпидемии в сетях. Исследовать поведение моделей на следующих сетях: 1) регулярная двумерная решетка 2) двумерная модель малого мира 3) случайный граф 4) модель предпочительного присоединения BA 5) данная сеть. Для каждой модели/сети построить усредненную зависимость распространения инфекции (% зараженных узлов) от времени при фиксированном выборе параметров модели.

    ПОЯСНЕНИЯ:
    В этом проекте требуется использовать два подхода:
    1. Моделирование т.е когда с помощью случайных блужданий моделируется распространение эпидемии по сети (переход соседей в "зараженнное" сосояние) и подсчитывается количество(доля) вершин в каждом статусе с течением времени (шагов цикла)
    2. Решение дифф. уравнений (на сети) используя матрицы смежности и уравнения выведенные на лекции. Для решение в Матлабе можно использовать функцию ode45. Решение дает вероятности нахождение каждого из узлов в одном из состояний как функцию времени Для сравнения с результатами (1) можно вычислить усредненные по всем узлам вероятности

    Итоговый вывод в работе должен содержать:
    1) итоговое сравнение распространения эпидемии на разных типах сетей (порог эпидемии и скорость ее распространения)
    2) сравнение решений полученных методом ДУ и моделированием

  2. Моделирование распространения влияния в сети Имплементировать a) Independent cascade model b) Linear thresholod model. Исследовать поведение моделей на тех же сетях, что и в предыдущем задании.

Материал к лекциям / Reading material

Основная литература по курсу / Textbooks

Книги / Books:

Обзоры / Reviews:

Програмное обеспечение / Software

Похожие курсы / Similar courses