Google APIがリリースされたころには、「マッシュアップ」という単語が流行っていたような気がする。
去年、Google Search APIやYahoo APIを使う案件があった。
Google Search APIは検索のAPIだが、一度に8件もしくは16件、64位までしか取得できなかったので、SEO順位を取得するには使いにくいと感じた。
そして、別件でWebのHTMLをスクレイピングする案件も出てきた。
正規表現で出来るかと思ったら、案外面倒でいろいろ悩んでいたら、TIDYというものを使えばよいことが分かった。
PHPにインストールするのは結構簡単だったが、使うとなると結構面倒だった。
どこかにTIDYの説明があり、結構役立った。
WAKATIの代わりに、MeCabやChaSenを使ったりして、結構面白いものが出来た。
しかし、作ったものが要求とあっているかというと、違うかもしれない。
さて、次はどれから片付けるか。