DQウォークという位置ゲーを始めたのですが、47都道府県に各4つずつ設置されているランドマークを巡るスタンプラリー的な要素が旅行のお供に面白そうで、攻略サイトの一覧で確認したランドマークに寄った帰宅後に、直ぐ近くにもう一つあることに気が付いて後悔したということがあって、ランドマーク名称とGoogleマップのリンクがある一覧の表示からGoogleマップ上にピンマーカーで表示するように変換したという作業のお話です。
まず PHP を使いウェブスクレイピングし、形式が href
とtext
という二つのキーを持つオブジェクトを配列とするデータを作ります。file_get_contents
してから正規表現でA
タグをマッチさせて…と思いゴニョゴニョやっていましたが、DOMを利用した方が簡単だということで方針を転換しました。
一覧ページを確認すると取り出したいURLにはgoo.gl
で短縮されたものとそうでないものが混ざっていましたが、いずれも/maps/
文字列が含まれていて、var_dump
で配列の長さが188あるのを確認しつつ、全てのhref
属性値をstrpos($href,'/maps/')
の条件で分岐し、短縮URLを戻しhref
キーの値としてオブジェクトを構成していきます。
$html = file_get_contents('https://appmedia.jp/dqwalk/3864508');
$dom = new DOMDocument;
@$dom->loadHTML(mb_convert_encoding($html, 'HTML-ENTITIES', 'UTF-8'));
$xpath = new DOMXPath($dom);
$links = [];
$query = '//a[
@href != ""
and not(starts-with(@href, "#"))
and normalize-space() != ""
]';
foreach ($xpath->query($query) as $node) {
$href = $xpath->evaluate('string(@href)', $node);
if(strpos($href,'/maps/')){
$links[] = [
'href' => getFollowUrl($href),
//'href' => $href,
'text' => $xpath->evaluate('normalize-space()', $node),
];
}
}
$json = json_encode($links, JSON_PRETTY_PRINT|JSON_UNESCAPED_UNICODE/*|JSON_UNESCAPED_SLASHES*/);
var_dump($json);
function getFollowUrl($string) {
preg_match('#^https://goo.gl/maps/#', $string, $match);
if(!$match) {
return $string;
}
$headers = get_headers($string, true);
return $headers['Location'][0];
}
短縮されたものから元のURLを取得する方法は、以前ツイッターボットを作った時に経験があったので再利用したのですが、パフォーマンスが非常に悪かったためにこの時点で表示側のAjaxによる動的なデータ生成読み込みを諦め、var_dump($json)
で出力したJSONデータをコピペして静的なファイルにすることにしました。更に短縮URLから元URLを取得する方法について、curl
を使う方法に加えてget_headers
を使う方法を知り、今回は後者を試してみましたがパフォーマンスの比較は別途検証しようと思います。
データができたところで次に表側ですが、緯度経度を動的にparseFloat
する必要があるところでコンソールがエラーを吐いて若干ハマりました。
const posFrom = { 'lat': 36.5431868, 'lng': 135.9460074 }
const minZoomLevel = 5.7
function initMap() {
map = new google.maps.Map(document.getElementById('maps'), {
center: {lat: posFrom.lat, lng: posFrom.lng},
zoom: minZoomLevel,
mapTypeId: google.maps.MapTypeId.ROADMAP,
})
for (let i = 0, max = DQWLandmarks.length; i '+lon+' , '+lat*/
})
infowindow.open(map, marker)
}
})(marker, i))
}
}
gistに置いたJSONデータは、間違いを見つけた4箇所ほど座標を調整しています。GPXに流用するなりご自由にお使いください。
更新: 位置ゲーでWi-Fi環境を推奨するとか、ゲームデータをサーバに自動で置かないとかの不便さもあり、不慮の事故によりレベル30くらいまできてやり直すのが面倒で引退することにしました涙。