こんにちは。今回はpythonでRSSフィールドの情報を取得する方法をご説明します。最新のニュースやブログの更新情報を定期的に確認したい場合など使用できます。
RSSとは
RSSとはWebサイトが更新されて場合、その新着情報を配信するフォーマットです。配信されたRSSにはWebサイトやブログなどの、記事のタイトル、リンク、要約、更新日時、などがテキスト形式で記載させています。この技術により、サイトへ直接アクセスしなくても、更新情報を取得出来ます。
最終コード
RSSフィールドを取得するには【feedparser】を使用します。
インストールしていない場合は予めインストールしてください。
pip install feedparser
では、さっそくコードから見ていきましょう。こちらをコピペすることで、ヤフーのビジネスニュースのRSSフィールドを取得できます。
import feedparser RSS_URL = "https://news.yahoo.co.jp/rss/topics/business.xml" d = feedparser.parse(RSS_URL) for entry in d.entries: print(entry.title) print(entry.link) print(entry.description) print(entry.updated) print(entry.updated_parsed) print(entry.updated_parsed.tm_year) print(entry.updated_parsed.tm_mon) print(entry.updated_parsed.tm_mday) print(entry.updated_parsed.tm_hour) print(entry.updated_parsed.tm_min) print(entry.updated_parsed.tm_sec) print(entry.updated_parsed.tm_wday) print(entry.updated_parsed.tm_yday) print(entry.updated_parsed.tm_isdst)
解説
1行目で【feedparser】をインポートしています。
3行目でRSSフィールドのURLを指定します。
4行目でURLを読み込んで、5行目以降で記事ごとに繰り返し処理を行っています。
取得できる項目
- entry.title:記事タイトル
- entry.link:記事のURL
- entry.description:記事の要約
- entry.updated:記事の公開日時
- entry.updated_parsed:記事の公開日時の辞書データ(リスト)
- entry.updated_parsed.tm_year:記事の公開年
- entry.updated_parsed.tm_mon:記事の公開月
- entry.updated_parsed.tm_mday:記事の公開日
- entry.updated_parsed.tm_hour:記事の公開時間
- entry.updated_parsed.tm_min:記事の公開分
- entry.updated_parsed.tm_sec:記事の公開秒
- entry.updated_parsed.tm_wday:記事の公開曜日
- entry.updated_parsed.tm_yday:年内の通し日数
- entry.updated_parsed.tm_isdst:夏時間が有効かどうか?
まとめ
いかがでしたでしょうか?非常に簡単なコードでサクッとデータを取得できました。RSSは多くのニュースやブログで配信されているので是非確認してみてください。
主なニュースのRSSアドレス
- ヤフーニュース(主要):https://news.yahoo.co.jp/rss/topics/top-picks.xml
- ヤフーニュース(経済):https://news.yahoo.co.jp/rss/topics/business.xml
- ヤフーニュース(エンタメ):https://news.yahoo.co.jp/rss/topics/entertainment.xml
- ITmedia 総合記事一覧:https://rss.itmedia.co.jp/rss/2.0/itmedia_all.xml
- ITmedia(企業・業界動向):https://rss.itmedia.co.jp/rss/2.0/news_industry.xml
- IT(情報技術) – 日経クロステック:https://tech.nikkeibp.co.jp/rss/xtech-it.rdf
業務支援ツールの製作を致します
株式会社FROMATIONではお客様の用途に合わせたオリジナルの業務支援(自動化)ツールを製作しております。
【毎日の10分を1秒に】
をコンセプトに、お客様の用途に特化したピンポイントな自動化ツールをご提供致します。「大手のRPAソフトを導入するまでもない日常ちょっとした手間」「毎日のルーチンワーク」など、簡単なツールで驚くほど業務が改善する場合もあります。
【毎日こんな作業で困ってるんだけど】
【こんなツール作れないかな】
など企業様も個人様もお気軽にお問い合わせください。
出来ることの一例
- webからのデータ収集
- Excelと連携したデータ処理
- メールの受信と自動返信
- データの自動アップロード
- 画像や音声データの編集・変換処
- 各種SNSの自動処理
上記以外にも出来ることは多数ありますので、お気軽にお問合せ下さい。