周末,我正在浏览 30 分钟内完成的项目创意,以便快速复习,并偶然发现了 codementor.io
那么,RSS Feed 到底是什么?
RSS 代表“真正简单的联合” — 它是一种通过 XML 文件访问网站元数据的方法。
例如,Medium 上有大量的文章和出版物,将所有带有摘要的链接都放在一个页面上不是很方便吗?
答案是——RSS 源!这些在几年前非常流行,但现在已经不再使用,但网站仍然为您提供创建自己的 RSS 提要的支持。
最近我开始阅读 Intermezzo,并想在 Medium 上阅读有关它的评论和最新更新,然后我想也许我可以为此创建一个 RSS feed?
好吧,快速搜索帮助我发现 Medium 确实支持通过其端点使用该特定元数据上的 Medium XML 元数据创建 RSS 提要。
您可以在这里找到它 - https://help.medium.com/hc/en-us/articles/214874118-Using-RSS-feeds-of-profiles-publications-and-topics
我使用库 feedparser 编写了一个快速的 Python 代码 - 它在内部解析 XML 文件以获取所需的元数据。如果您也想自己解析元数据,我也对 BeautifulSoup 做了同样的事情。
您可以在此处查看 feedparser 的文档 — https://feedparser.readthedocs.io/en/latest/
我使用以下代码解析并检索了媒体元数据 -
parsed_feed = feedparser.parse(url) for article in parsed_feed["entries"]: response_article.append({ "Title": article["title"], "Description": html2text.html2text(article["summary"]), "Author": article["author"], "Date Published": article["published"], "Last Updated": article["updated"] })
为了使其更加用户友好,我创建了一个快速的 Python 类,并让用户输入应从中接收元数据的 URL,您可以在 Carbon 或 Github 上找到完整代码的链接:
Github:https://github.com/harmankaler2000/RSS_Feeder
碳:https://carbon.now.sh/mHN9yVFtZZmkopLHFEe3
我很乐意联系并讨论更多有关Python的内容,请随时发表评论,我们可以聊天!
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3