Wave Technology(WTI)-ウェーブ・テクノロジ

WTIは技術者不足を解決する「開発設計促進業」です

Raspberry Piでスクレイピング ~準備編~

みなさん、こんにちは。
システム設計課の中野と申します。よろしくお願いいたします。

今回と次回の2回のブログで、Raspberry Piを使って、Webの情報取得(スクレイピング)をやってみます。
まず、今回は準備編として、必要なソフトをRaspberry Piにインストールして環境構築していこうと思います。

 

■Raspberry Piとは

もはや、説明不要かもしれませんね。通称ラズパイとして親しまれるシングルボードコンピュータです。今回は、実験室に転がっていたRaspberry Pi 3 Model B+を使います。

CPUはBroadcomの64bitクアッドコア 動作周波数1.4GHzのBCM2837B0、メモリは1GB、インタフェースはUSB、有線LAN、Wi-Fiを備えます。映像出力はHDMIです。

 

■スクレイピングとは

Webページから必要な情報を抽出するソフトウェア技術のことです。マーケティングや業務効率化のための、データの自動収集に使われています。

今回は、ブラウザはChromium、Webブラウザの操作にはSelenium、そして、ブラウザのドライバにChromium driverを使用します。

 

それでは実際に作っていきましょう!

 

■Raspberry Piの準備

実際に、スクレイピングを行うプログラムを書く前に、以下の2つをインストールしていきます。

  • Chromium driver : ブラウザ操作用のドライバ
  • Selenium : ブラウザ操作用のフレームワーク

※今回のRaspberry PiのOSは、Raspbian GNU/Linux 10 (buster)を使用しています。

Chromium driverは、↓の感じでインストールしていきます。

 

 

Seleniumは↓の感じでインストールが行われます。

 

 

最後にChromiumブラウザとChromiumdriverのバージョンを確認しておきます。

 

 

Raspberry Piで、スクレイピングの環境構築の際に注意するところは、ChromiumブラウザとChromiumdriverのバージョンが、合っているか確認するところですね。これが合っていないと動かなくて困ります。

あと、必要となるChromiumブラウザとPythonとCronは元々OSに入っています。
Pythonは、今回プログラミングで使用する言語として選んでいます。Cronは、指定した時間にプログラムを実行できる、UNIX系の常駐プログラムです。

 

さあこれで、道具はそろいました。次回はPythonでプログラムを書いて、Webの勤怠情報取得(スクレイピング)を行ってみます。情報取得後、確認もかねて前回のブログで作成した電子ペーパー名札を、勤怠に連動させてみようと思います。

 

WTIでは、このような感じで楽しく開発を行っています。システム設計課ではIoT関連のラピットプロトタイピングを得意としており、組み込み機器の回路設計、基板設計、ソフトウェア設計、筐体設計は弊社で一貫して行えますので、設計でお悩みの方は、ぜひ弊社にお任せください。

また、今回のブログの内容は、インターンシップの資料にもなっていますので、興味のある学生さんは、ぜひ参加してみてください。

 

それではまた、次回お会いいたしましょう!

 

【関連リンク】

【関連ブログ】

 

【関連動画】

 

WTIメールマガジンの配信(無料)

WTIエンジニアが携わる技術内容や日々の業務に関わる情報などを毎週お届けしているブログ記事は、メールマガジンでも購読できます。ブログのサンプル記事はこちら

WTIメールマガジンの登録・メールアドレス変更・配信停止はこちら

 

WTI動画リンクはこちら
WTIの技術、設備、設計/開発会社の使い方、採用関連など、幅広い内容を動画で解説しています。

 

 © 2005 Wave Technology Inc.