pagerank
index
c:\users\gige\pycharmprojects\oisisi_python\search\pagerank.py

PageRank algorithm with explicit number of iterations.
 
Returns
-------
ranking of nodes (pages) in the adjacency matrix

 
Modules
       
numpy

 
Functions
       
construct_pr_adj_matrix(graph: structures.graph.Graph, ordered_list: list)
Calculates Adjacency matrix needed for PageRank
 
M[i,j] ->
            0 (if j and i are not connected)
            1 / number of outgoing links from j (if link from j to i exists)
Sum of each column is 1.
 
:param graph: graph from a PopulateStructures object
:param ordered_list: ordered HTML files list (PopulateStructures object)
:return: pagerank adjacent matrix
pagerank(M, num_iterations: int = 100, d: float = 0.85)
PageRank: The trillion dollar algorithm.
 
Parameters
----------
M : numpy array
    adjacency matrix where M_i,j represents the link from 'j' to 'i', such that for all 'j'
    sum(i, M_i,j) = 1
num_iterations : int, optional
    number of iterations, by default 100
d : float, optional
    damping factor, by default 0.85
 
Returns
-------
numpy array
    a vector of ranks such that v_i is the i-th rank from [0, 1],
    v sums to 1