python – 在HTML页面快速算法中查找单词
发布时间:2020-09-18 13:34:18 所属栏目:Python 来源:互联网
导读:我需要做一个布尔函数,如果一个单词在HTML页面的文本中,则返回true,如果不在,则返回false.我知道分析所有页面树直到用lxml库查找单词很容易,但我发现迭代所有html块并查找单词是否存在效率低下.对更快算法的任何建议(我需要这么多次搜索)?最佳答案只要你不担
我需要做一个布尔函数,如果一个单词在HTML页面的文本中,则返回true,如果不在,则返回false. 我知道分析所有页面树直到用lxml库查找单词很容易,但我发现迭代所有html块并查找单词是否存在效率低下. 对更快算法的任何建议(我需要这么多次搜索)? 最佳答案 只要你不担心在元素属性或其他东西中意外找到单词(如果你担心这一点,用lxml之类的东西解析HTML是你唯一的选择),你可以只处理整个HTML将文档作为一个大字符串并在其中搜索您的单词: (编辑:岳阳站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
相关内容
- python – 如何修补`__call__`方法?
- python – 将数字字符引用表示法转换为unicode字符串
- 在Python的Cmd.cmd中完成filename tab-completion
- 对相关python进口的极限答案
- 如何将intersphinx与特定于django的结构(如设置)相关联?
- python模块之shutil
- python – 用箭头标记matplotlib直方图bin
- python – 使用Jinja2模板中的DateTimeFields显示本地时间
- python芹菜max-tasks-per-child-setting默认值
- python – 多进程还是多线程? – 并行化数百万次迭代的简单