Lesson10 Webサイトから繰り返し抽出したデータをExcelに列名マッピングで出力しよう フォローする
【ラーニング Lesson10】
Lesson概要
cobitでログイン後、Webサイトから『抽出要素の繰り返し』で繰り返しテキストデータを取得し、取得したテキストを一括でExcelファイルに出力する方法を学びます。
🎖️POINT
Excelに出力する時は、『列名でマッピングする』を使用してみよう!
このLessonで学べること
・『抽出要素の繰り返し』ステップを作成する際に『開始位置をずらす』方法
・選択した『対象を選び直す』操作を行う方法
・『列名でマッピングする』(以下、『列名マッピング』)機能を使い出力する方法
作成するロボット
以下のWebサイトから『抽出要素の繰り返し』ステップを利用して、テキストデータをcobitで取得し、Excelファイルに全てのデータを『列名でマッピングする』機能を使用して出力するロボットを作成します。
https://cobit-learning.biztex.co.jp/tips/table-data
出力結果のイメージ
解説テキスト
1. cobitにExcelファイルを設定して、ロボットを新規作成します。
※Excelファイルです
『列名マッピング』機能を使用するのでヘッダー行に、NO・建物名・オーナー名・住所・間取り・最寄駅というテキストが入っています。
2. cobit編集画面から、以下のWebサイトにアクセスします[URLを開く]
https://cobit-learning.biztex.co.jp/tips/table-data
※操作手順が不明な場合は、Lesson1を確認してください。
3. 抽出要素の繰り返しを設定します [繰り返しの抽出]
a.仮想ブラウザ上で『NO』を選択します。
b.再び同じ要素をクリックします。
選び直す対象の候補の一覧のダイアログが表示されます。
🎖️POINT
対象を2回クリックすると周辺の要素から「対象を選び直す」ことができます。
c.行で『繰り返しの抽出』ステップを行いたいため『行(表)』を選択します。
d.名前に『table dataの繰り返し』と入力して、『保存』を選択します。
※任意の名前で構いません
※オレンジ色になっている要素の回数分繰り返します
e.一行目はヘッダーなので『開始位置をずらす』に『1』と入力し『保存』ボタンを選択してください。
🎖️POINT
今回は表のヘッダー部分(1行目)が含まれており2行目から処理を行うために、
『開始位置をずらす』に『1』を入力します。
f.[抽出要素の繰り返し]ステップが作成できました。
4. 対象テキストを取得します [テキストの取得]
a.取得したい対象に[テキストの取得]ステップを選択します。
『列名マッピング』を使用するので、Excelに記載してある名前をそれぞれ入力します。
※NO・建物名・オーナー名・住所・間取り・最寄駅
※Excelに用意している列名と[テキストの取得]ステップでつけた名前が違う場合、Excelに出力されないので注意してください
値(選択する要素) | 取得時につける名前 |
0001 | NO |
山口ビル | 建物名 |
鈴木一郎 | オーナー名 |
東京都北区300丁目 | 住所 |
3LDK | 間取り |
赤羽荒川駅 | 最寄駅 |
f. [テキストの取得]ステップの緑枠の中に取得したテキストが表示されたことを確認して下さい。
5. 取得したテキストをExcelに出力します [ファイルに出力]
a.『抽出要素の繰り返し』ステップで、取得したデータをExcelに出力します。
出力方法を『列名でマッピングする』にチェックを入れることで、Excelの列名に合わせてテキストを出力することができます。
b.『追加』ボタンをクリックします。
6. 編集を終了して、ロボットを実行します。
※操作手順が不明な場合は、Lesson1を確認してください。
完成フロー図
出力イメージ
補足
[抽出要素の繰り返し]ステップ開始位置変更について
『抽出要素の繰り返し』ステップは、開始位置を自由に選べるので広告やヘッダーを避けることができます。
[対象を選び直す]
cobitで選択した対象の要素を広げたり狭めたりする操作が行なえます。 cobit上でクリックするだけでは、操作を行いたい要素をうまく選択できない場合に利用します。
cobit上で選択可能な要素をクリックして、再び同じ要素をクリックします。
選び直す対象の候補の一覧が表示されます。候補の上にマウスカーソルを移動すると、仮想ブラウザ上でその候補が対象とする要素に緑色の枠が表示されます。
[列名でマッピング]
出力したいExcel上のヘッダー(シートの1行目)の値と、cobitでテキストを取得した時につけた名前が同じ場合に、 ファイルに出力ステップ1つで対応する列にテキストを一括して出力することができる機能です。