今回はスプレッドシートなどでサイトのタイトル情報を取得する方法2選ご紹介します。
サイトのタイトル情報を取得
htmlソースで確認する
Webページをブラウザで開いたのち、右クリックで「ページのソースを表示」(またはhtmlを表示等)を行うことで、htmlソースを確認することができます。

htmlソースの中に以下のようにタイトルが記載された箇所があり、これがWebページのタイトルになります。
この箇所がGoogle検索結果のタイトルとして表示される情報であり、Webページの中でもっとも重要な要素の1つです。
1 | < title >ここがタイトル</ title > |

Googleスプレッドシートで確認する
上記方法でも確認を行うことができますが、たくさんのURLの情報を一気に確認する方法をご紹介します。
オンラインで活用することができる”Googleスプレッドシート”を利用します。
基本的にはMicroSoftExcelと同じようなソフトではありますが、Googleスプレッドシートにしかできない便利なサービスがあります。
こちらでは「importxml」という関数を用いてクローリング(情報の自動収集)ができてしまう関数を用います。

下記のサンプルをコピーしてご利用ください。
https://docs.google.com/spreadsheets/d/1CSI7gHeMJGVdizTR99yWn5KZJAwlW6ENhy6ew_uqIvw/edit?usp=sharing
POINT
エクセルにはないGoogleスプレッドシートならではの機能を活用しスキルアップを目指しましょう。
コメント