新聞中心
最近,又有一款Python可視化工具火了。

10多年的偏關(guān)網(wǎng)站建設(shè)經(jīng)驗,針對設(shè)計、前端、開發(fā)、售后、文案、推廣等六對一服務(wù),響應(yīng)快,48小時及時工作處理。成都全網(wǎng)營銷的優(yōu)勢是能夠根據(jù)用戶設(shè)備顯示端的尺寸不同,自動調(diào)整偏關(guān)建站的顯示方式,使網(wǎng)站能夠適用不同顯示終端,在瀏覽器中調(diào)整網(wǎng)站的寬度,無論在任何一種瀏覽器上瀏覽網(wǎng)站,都能展現(xiàn)優(yōu)雅布局與設(shè)計,從而大程度地提升瀏覽體驗。成都創(chuàng)新互聯(lián)公司從事“偏關(guān)網(wǎng)站設(shè)計”,“偏關(guān)網(wǎng)站推廣”以來,每個客戶項目都認(rèn)真落實執(zhí)行。
這一次,功能是針對圖聚類問題的社群結(jié)構(gòu)進(jìn)行檢測、可視化。
該項目的帖子在reddit上一經(jīng)發(fā)布,就被頂?shù)搅恕皺C(jī)器學(xué)習(xí)板塊”的榜首。
一起來看看它究竟都能用來做什么吧~
功能亮點(diǎn)
這款工具叫做communities, 是一個Python庫,用于圖聚類問題的社群結(jié)構(gòu)檢測。
它支持多種算法,包括:
- Louvain算法;
- Girvan-Newman算法;
- 層次聚類算法;
- 光譜聚類算法;
- Bron-Kerbosch算法。
更贊的是,communities還可以實現(xiàn)這些算法的可視化。
具體了解一下~
導(dǎo)入算法并插入矩陣
這里以Louvain算法為例。
這是一種基于模塊度的社群發(fā)現(xiàn)算法,也是貪心算法。
它根據(jù)頂點(diǎn)的共享邊將頂點(diǎn)排列成社群結(jié)構(gòu),也就是說,它將節(jié)點(diǎn)分為幾個社群,每個社群之間共享很少的連接,但是同一社群的節(jié)點(diǎn)之間共享許多連接。
最終,讓整個社群網(wǎng)絡(luò)呈現(xiàn)出一種模塊聚集的結(jié)構(gòu),實現(xiàn)整個社群網(wǎng)絡(luò)的模塊度的最大化。
所以首先,我們需要構(gòu)建一個表示無向圖的鄰接矩陣,可以加權(quán),也可以不加權(quán),矩陣為2Dnumpy數(shù)組。
n*n矩陣則表示有n個節(jié)點(diǎn),矩陣的每個位置分別表示各節(jié)點(diǎn)之間邊的關(guān)系,有邊則為1,沒有邊則為0。
然后,只需從communities.algorithms中導(dǎo)入算法并插入矩陣。
- import numpy as np
- from communities.algorithms import louvain_method
- adj_matrix = np.array([[0, 1, 1, 0, 0, 0],
- [1, 0, 1, 0, 0, 0],
- [1, 1, 0, 1, 0, 0],
- [0, 0, 1, 0, 1, 1],
- [0, 0, 0, 1, 0, 1],
- [0, 0, 0, 1, 1, 0]])
- communities, _ = louvain_method(adj_matrix)
- # >>> [{0, 1, 2}, {3, 4, 5}]
接下來輸出社群列表,每個社群即為一組節(jié)點(diǎn)。
實現(xiàn)可視化,并進(jìn)行顏色編碼
利用communities將圖進(jìn)行可視化,將節(jié)點(diǎn)分到社群中并進(jìn)行顏色編碼,還可以選擇深色或淺色背景、保存圖片、選擇圖片的分辨率等等 。
- draw_communities(adj_matrix : numpy.ndarray, communities : list, dark : bool = False, filename : str = None, seed : int = 1)
其中各參數(shù)的具體含義為:
- adj_matrix (numpy.ndarray):圖的鄰接矩陣;
- dark (bool, optional (default=False)):如果為 True, 則繪圖為深色背景,否則為淺色背景;
- filename (str or None, optional (default=None)):通過 filename 路徑可以將圖另存為PNG格式; 設(shè)置 None 則是用交互方式顯示圖;
- dpi (int or None, optional (default=None)):每英寸的點(diǎn)數(shù),控制圖像的分辨率;
- seed (int, optional (default=2)):隨機(jī)種子。
具體到Louvain算法的可視化,代碼是這樣的:
- from communities.algorithms import louvain_method
- from communities.visualization import draw_communities
- adj_matrix = [...]
- communities, frames = louvain_method(adj_matrix)
- draw_communities(adj_matrix, communities)
動畫呈現(xiàn)算法
communities 還可以動畫呈現(xiàn)節(jié)點(diǎn)分配到社群的過程。
- louvain_animation(adj_matrix : numpy.ndarray, frames : list, dark : bool = False, duration : int = 15, filename : str = None, dpi : int = None, seed : int = 2)
其中各參數(shù)的含義如下:
- adj_matrix (numpy.ndarray):圖的鄰接矩陣;
- frames (list):算法每次迭代的字典列表;
- 每個字典都有倆個鍵:“C”包含節(jié)點(diǎn)到社群的查找表,“Q”表示圖的模塊度數(shù)值;
- 此字典列表是 louvain_method的第二個返回值;
- dark (bool, optional (default=False)):如果為 True, 則動畫為深色背景和配色方案,否則為淺色方案;
- duration (int, optional (default=15)):動畫所需的持續(xù)時間,以秒為單位;
- filename (str or None, optional (default=None)):通過filename 路徑將動畫存為GIF;設(shè)置None則以交互方式展示動畫;
- dpi (int or None, optional (default=None)):每英寸點(diǎn)數(shù),控制動畫的分辨率;
- seed (int, optional (default=2)):隨機(jī)種子。
例如,空手道俱樂部網(wǎng)絡(luò)中Louvain算法的動畫呈現(xiàn):
- from communities.algorithms import louvain_method
- from communities.visualization import louvain_animation
- adj_matrix = [...]
- communities, frames = louvain_method(adj_matrix)
- louvain_animation(adj_matrix, frames)
我們可以看到Louvain算法的動態(tài)過程:
- 首先掃描數(shù)據(jù)中的所有節(jié)點(diǎn),將每個節(jié)點(diǎn)看做一個獨(dú)立的社群;
- 接下來,遍歷每個節(jié)點(diǎn)的鄰居節(jié)點(diǎn),判斷是否將該節(jié)點(diǎn)加入鄰居節(jié)點(diǎn)所在的社群,以提升模塊度;
- 這一過程重復(fù)迭代,直到每一個節(jié)點(diǎn)的社群歸屬穩(wěn)定;
- 最后,將所有在同一個社群的節(jié)點(diǎn)壓縮成一個新節(jié)點(diǎn),計算新節(jié)點(diǎn)的權(quán)重,直到整個圖的模塊度穩(wěn)定。
大家可以通過文末鏈接,自行嘗試一下其他算法~
此外,它還可以用于社群間鄰接矩陣、拉普拉斯矩陣以及模塊度矩陣等。
對于這款工具,不少網(wǎng)友發(fā)出“awesome”、“really cool!”等花式贊嘆,表示正是自己需要的。
當(dāng)然,也有網(wǎng)友提出疑問,例如:是否可以指定執(zhí)行的迭代次數(shù)(例如:提前停止)?
開發(fā)者對此表示:不能,但是對于某些算法,可以指定要將圖形劃分為多少個社群。
本文題目:這個圖聚類Python開源工具火了:可對社群結(jié)構(gòu)進(jìn)行可視化、檢測
網(wǎng)頁路徑:http://www.fisionsoft.com.cn/article/dpiiccj.html


咨詢
建站咨詢
