【無料ツール】類似コンテンツ発見の目安に使える「レーベンシュタイン距離」計算ツール

 投稿:2012年1月3日(中山陽平)

前回のパンダアップデート対策の記事、プログラミング側からシステム側から行なう対策の記事でした。

この記事の中で参考になる数字としてあげている「レーベンシュタイン距離」を簡単に出せないかと言うコメントをFacebookにて頂きました。

▼Facebookページ「海外発のWEB戦略・戦術情報を共有しよう!」

なので、原文のようにPHPは使わずJavaScriptですが作ってみました。

JavaScriptの元ネタはこちらです。

▼Levenshteinenator

http://andrew.hedges.name/

experiments/levenshtein/

また、これ以外にも「levenshtein Javascript」で検索すれば結構出てきます。

ただの計算式なので、どんな言語でもいけるかと。

元記事ではPHPでしたがPHPはそもそもビルトインで関数を持っています。

注意点

本来原文ではDB内のテキストを比較する、という趣旨で紹介されている物です。

DB内に格納されているテキストで類似な物がないかを調べるという趣旨です。

こうやってオンラインツールとして使うに当たっては以下をご注意下さい。 

レーベンシュタイン類似度チェックツール

先ほどの注意点をご留意頂き、便利に使ってもらえれば幸いです。何かありましたらFacebookページなどで一声おかけ頂ければ幸いです。

 投稿:2012年1月3日(中山陽平)

株式会社ラウンドナップ
(ラウンドナップ・コンサルティング)
代表取締役:中山陽平
〒352-0011 埼玉県新座市野火止6-13-9
TEL : 048-234-3361(※平日10時〜16時)
ChatWorkID:nakayama.yohei
Email : info@roundup-consulting.jp