人気記事・ランダム記事等紹介の忍者レコメンドが大幅にパワーアップした件

公開日: : 最終更新日:2014/08/14 サイト制作, 関連記事等

スポンサーリンク

以前このブログにて忍者レコメンドの紹介記事を書きました。その際にこのブログにも忍者レコメンドを設置してみて様子を見ていたのですが、サムネイルの画像の抽出精度が悪いと感じていました。

実際、このブログパーツはRSSに表示されている画像のみを抽出していたようで、ほとんど全部の内容を追記として記事を書いて、RSS上に画像(タグ)が掲載されてないこのブログでは追記に画像を貼りつけていてもサムネとして画像がピックアップされず、ほとんどが「No Image」の記事として紹介されるがままとなっていてもんもんとする日々が続いていました。

…しかし、2014/5/2になって忍者レコメンドのお勧め記事のところを見てみるとサムネがきちんと表示されているではないですか!!これは!と思い公式ページを見てみると次の掲示がなされていました。(以下抜粋)

画像取得のロジックを変更し、画像の取得率が向上しました。
RSS内に画像情報が無い場合の画像再取得ロジックに変更を加え、画像の取得率が向上しました。
・記事余白のCSS仕様に変更を加えました。margin-right:10px→margin:5px
・現在配信されているRSSの記事情報を5000件以内であれば全て取得するように変更しました。
・記事クリックユーザー数を計測し、且つリンク先へのリファラーを維持するためにリンククリック時のブラウザの挙動に変更を加えました(近日中にクリックユーザー数を元にしたレコメンド機能を開始予定)。
・近日中に予定している管理画面への設定項目追加に備えて、JS配信の仕組と内容を大幅に見直しました。
・弊社サイトへリンクするバナーデザインを変更いたしました。
(「『忍者レコメンド』アップデートのお知らせ」より抜粋)

これはすごい!!
一気にめちゃめちゃ便利になったと私は思いました。たぶんはじめからこれに気を使ってアイキャッチ画像や本文に画像タグを設置しているというかたには「だからどうした」という内容かもしれないですが、記事からサムネを抽出するって結構難しいことだと思います。

私も以前サムネ抽出をやったことがあり、手順としてRSSで得られる2つ以上の複数記事からimgタグを正規表現でそれぞれ抽出し、それらを記事ごとに比較して一番初めに一致しなかった画像タグをその記事のサムネイルとするというものを行っていたのですが、これだとランダムに表示される画像などが誤って抽出されてしまうなどの欠点がありました(特にAmazonのアフィ画像)。なのでかなり正確に抽出するにはメインコンテンツがどこかを特定する処理が必要なのかなぁと思いますが、これもまた高い精度でとなると結構難しいことです。

最後に、このブログパーツのサムネ抽出精度がどれほどのものなのか正確にはわからないですが、以前のブログではほぼ100%の精度で検出できてるように思えますので安心して使えると思います。

スポンサーリンク
Amazon
  • このエントリーをはてなブックマークに追加

関連記事

【PHP】headerでContent-Typeを指定したのに効かない場合の対処法

PHPでサイトマップを作ろうと思い、XML形式のファイルを出力しようとしてheaderを指定したのに

記事を読む

livedoorblogのタグのページが404 Not Found

別のブログとしてライブドアのものを使っているのですが、タグを編集していた際に特定のタグ一

記事を読む

スマホ向け幅固定サイトの回転時の幅対応方法

幅固定サイトでのスマホ回転時Webサイトの横幅を合わせる方法のメモ。 下記2点の設定が必要です。

記事を読む

かわいい女の子のアイコンやアバター画像を作れるサイト

TwitterやFacebookなどでアイコンが欲しくなることってあるかと思います。私も色々検索して

記事を読む

人気記事表示ブログパーツの忍者レコメンドを使ってみる

忍者レコメンドとは 今回は忍者レコメンドという人気記事表示のブログパーツを紹介します。忍者レコメン

記事を読む

さくらサーバーにフォルダをアップロードする方法

さくらサーバーにフォルダをアップロードする…という機能は無いみたいで個別にFTPソフトを使う必要があ

記事を読む

さくらとロリポップのcronについての比較

私は今さくらのレンタルサーバーとロリポップのレンタルサーバーを両方試してみているのですがそのcron

記事を読む

FC2ブログからWordPressへの引っ越しについて

今までFC2ブログでメモを残していましたが、WordPressに移行することにしました。理由としては

記事を読む

【PHP】Twitterのツイート数やはてぶ数を取得する

指定URLのTweet数の取得 Twitterでツイート数を取得するには指定のURLにアクセスする

記事を読む

お名前.comのでサブドメインを取得してロリポップで使う方法

タイトルどおりなのですがお名前.comで取得した独自ドメインからサブドメインを取得し、ロリポップで使

記事を読む

NVIDIA DIGITSをSupervisorを使って自動起動する

はじめに 先日Ubuntu14.04にDIGITS 5をGPUなしP

【2017年度】GeForce 1080 Ti搭載BTOパソコン比較

はじめに 最近ディープラーニング用にGPUのないPCにDIGITSを

Windows用のシンプルなストップウォッチソフト紹介

Windows(10)でも使える使いやすいKAZAMITimerという

MNISTをDIGITS 5のCPUのみで試す(GPUなし)

はじめに DIGITSを使えばGUI操作で簡単にディープラーニングが

Windowsユーザが初めてMacBookを購入したときの注意点や感想

最近12インチのMacBookを購入しました。今までWindowsしか

Redmine3.2をUbuntu14.04にインストールして躓いた所についてメモ

はじめに Ubuntu14.04 ServerにRedmine3.2

UWSCを使ったソフト自動立ち上げ【SoftEther VPN Server】

やりたいこと 最近SoftEtherという筑波大学発のベンチャー企業

→もっと見る

  • Author : ががんぼ
    プログラミングやWeb関係で気付いたことについてメモしていく予定。だいたいが備忘録ですが、自分でサンプルを作って動かしてみたりしています。
PAGE TOP ↑