Newspaper

Newspaper

Newspaper是使用Python 3构建的新闻,全文和文章元数据提取。特征-支持10多种语言(英语,中文,德语,阿拉伯语,...)-多线程文章下载框架-新闻网址识别-从html提取文本-从html提取顶部图像-从html提取所有图像-从文本提取关键字-从文本提取摘要-从文本提取作者-Google趋势术语提取
newspaper-metadata-extractor-

分类目录

BSD版Newspaper的替代品