人気記事・ランダム記事等紹介の忍者レコメンドが大幅にパワーアップした件

公開日: : 最終更新日:2014/08/14 サイト制作, 関連記事等

スポンサーリンク

以前このブログにて忍者レコメンドの紹介記事を書きました。その際にこのブログにも忍者レコメンドを設置してみて様子を見ていたのですが、サムネイルの画像の抽出精度が悪いと感じていました。

実際、このブログパーツはRSSに表示されている画像のみを抽出していたようで、ほとんど全部の内容を追記として記事を書いて、RSS上に画像(タグ)が掲載されてないこのブログでは追記に画像を貼りつけていてもサムネとして画像がピックアップされず、ほとんどが「No Image」の記事として紹介されるがままとなっていてもんもんとする日々が続いていました。

…しかし、2014/5/2になって忍者レコメンドのお勧め記事のところを見てみるとサムネがきちんと表示されているではないですか!!これは!と思い公式ページを見てみると次の掲示がなされていました。(以下抜粋)

画像取得のロジックを変更し、画像の取得率が向上しました。
RSS内に画像情報が無い場合の画像再取得ロジックに変更を加え、画像の取得率が向上しました。
・記事余白のCSS仕様に変更を加えました。margin-right:10px→margin:5px
・現在配信されているRSSの記事情報を5000件以内であれば全て取得するように変更しました。
・記事クリックユーザー数を計測し、且つリンク先へのリファラーを維持するためにリンククリック時のブラウザの挙動に変更を加えました(近日中にクリックユーザー数を元にしたレコメンド機能を開始予定)。
・近日中に予定している管理画面への設定項目追加に備えて、JS配信の仕組と内容を大幅に見直しました。
・弊社サイトへリンクするバナーデザインを変更いたしました。
(「『忍者レコメンド』アップデートのお知らせ」より抜粋)

これはすごい!!
一気にめちゃめちゃ便利になったと私は思いました。たぶんはじめからこれに気を使ってアイキャッチ画像や本文に画像タグを設置しているというかたには「だからどうした」という内容かもしれないですが、記事からサムネを抽出するって結構難しいことだと思います。

私も以前サムネ抽出をやったことがあり、手順としてRSSで得られる2つ以上の複数記事からimgタグを正規表現でそれぞれ抽出し、それらを記事ごとに比較して一番初めに一致しなかった画像タグをその記事のサムネイルとするというものを行っていたのですが、これだとランダムに表示される画像などが誤って抽出されてしまうなどの欠点がありました(特にAmazonのアフィ画像)。なのでかなり正確に抽出するにはメインコンテンツがどこかを特定する処理が必要なのかなぁと思いますが、これもまた高い精度でとなると結構難しいことです。

最後に、このブログパーツのサムネ抽出精度がどれほどのものなのか正確にはわからないですが、以前のブログではほぼ100%の精度で検出できてるように思えますので安心して使えると思います。

スポンサーリンク
Amazon
  • このエントリーをはてなブックマークに追加

関連記事

さくらサーバーにフォルダをアップロードする方法

さくらサーバーにフォルダをアップロードする…という機能は無いみたいで個別にFTPソフトを使う必要があ

記事を読む

【HTML/jQuery UI】NumericUpDownを設置する【Spinner】

HTMLタグにNumericUpDownがないか探したのですがないみたいなのでそれが使えるようなもの

記事を読む

任意URLのTweetボタンを複数設置する

TwitterのTweetボタンをWebサイトやブログに複数設置する方法です。複数設置するということ

記事を読む

スクレイピングをサポートしてくれるAPI【kimono】

kimonoというスクレイピングをAPI化してくれるという素晴らしいサービスがあります。

記事を読む

【PHP】Twitterのツイート数やはてぶ数を取得する

指定URLのTweet数の取得 Twitterでツイート数を取得するには指定のURLにアクセスする

記事を読む

ニコニコ動画のユーザーおよびマイリストのRSSフィード

ニコニコ動画のユーザーページのRSSフィードおよびマイリストのRSSフィードは次のようになっています

記事を読む

指定URLのWebサイトの画面全体をキャプチャする方法

Webサイトのスクリーンショットを撮る方法としてはいくつかありますが、各方法ごとに調べたものを紹介し

記事を読む

ブログのコメント欄をTwitterやFacebook、はてなのコメントで代用する方法

最近になってコメント欄にスパムっぽいものが大量に飛んでくるようになったのでどうにかしないと、と思い一

記事を読む

livedoorblogのタグのページが404 Not Found

別のブログとしてライブドアのものを使っているのですが、タグを編集していた際に特定のタグ一

記事を読む

【jQuery/javascript】はてなボタンを動的に設置する

はてなブックマークのボタンをページの読み込みが終わった後にjavascript(jQuery)で追加

記事を読む

Windowsユーザが初めてMacBookを購入したときの注意点や感想

最近12インチのMacBookを購入しました。今までWindowsしか

Redmine3.2をUbuntu14.04にインストールして躓いた所についてメモ

はじめに Ubuntu14.04 ServerにRedmine3.2

UWSCを使ったソフト自動立ち上げ【SoftEther VPN Server】

やりたいこと 最近SoftEtherという筑波大学発のベンチャー企業

【PHP】headerでContent-Typeを指定したのに効かない場合の対処法

PHPでサイトマップを作ろうと思い、XML形式のファイルを出力しようと

スマホ向け幅固定サイトの回転時の幅対応方法

幅固定サイトでのスマホ回転時Webサイトの横幅を合わせる方法のメモ。

【PHP】特定のURLからそのAtomやRSSのフィードを抽出する方法

特定のURLからRSSやATOMのフィードを抽出する方法をメモ。 流

フィード抽出ツール(RSS1.0、RSS2.0、atom)

任意URL サイト名 サイトURL RSS1.0

→もっと見る

  • Author : ががんぼ
    プログラミングやWeb関係で気付いたことについてメモしていく予定。だいたいが備忘録ですが、自分でサンプルを作って動かしてみたりしています。
PAGE TOP ↑