parse_html_tree
index
c:\users\gige\pycharmprojects\oisisi_python\parse\parse_html_tree.py

 
Modules
       
os
structures

 
Classes
       
builtins.object
PopulateStructures

 
class PopulateStructures(builtins.object)
    PopulateStructures(top, ui_ux=True)
 
Populate word trie tree and links graph from all HTML documents in a folder (complete directory tree).
graph and trie are attributes of this class (instances of data structures implemented in structures package)
 
  Methods defined here:
__init__(self, top, ui_ux=True)
Initialize self.  See help(type(self)) for accurate signature.

Data descriptors defined here:
__dict__
dictionary for instance variables (if defined)
__weakref__
list of weak references to the object (if defined)

 
Functions
       
get_html_documents_list(top)
Returns paths of all html documents in specified directory's tree
:param top: top directory path
:return: list of paths of all html files in tree of top directory