Excelでファジー検索(アドイン&ランプ;Power Query使用時)

  • これを共有
Hugh West

異なるデータの完全一致の他に部分一致をさせようとする場合は ファジー・ルックアップ この記事では、その導入と使用方法について説明します。 ファジー・ルックアップ というExcelの機能を利用しています。

ワークブックダウンロード

ファジー・ルックアップ.xlsx

ファジィ・ルックアップ・エクセルの目的

を使用しています。 ファジー・ルックアップ の機能を使えば、2つのデータテーブルの部分一致を示すことができ、さらに、この機能を使って完全一致も試すことができます。

の販売記録を含む2つのデータセットがあります。 1月 2月 エックスアイゼット これらのデータセットを使って、「翔泳社」と「翔泳社」の類似性を探ります。 製品 セールスパーソン の列は、この2つのデータ範囲になります。

ファジー・ルックアップ・アドインのダウンロードリンク

まず、以下のリンクをクリックして、このアドインをインストールする必要があります。

ファジー・ルックアップ・アドイン ダウンロードリンク

インストールが完了すると、Excelワークブックを開いたときに、この機能が自動的に追加されます。 ここでは、新しいタブとして ファジー・ルックアップ を持つものです。 ファジー・ルックアップ オプションです。

ファジィ・ルックアップ・エクセルの使用手順

今回は、その使用手順を示してみます。 ファジー・ルックアップ のファジーマッチング・オプションとともに、Excelの機能を利用することができます。 パワークエリ で、2つのデータテーブルの部分的なマッチングを示す。

を使用しています。 Microsoft Excel 365 のバージョンがありますが、ご都合に合わせて他のバージョンもお使いください。

1.ファジー・ルックアップ・アドインの活用

Step-01:ファジー検索用の2つのテーブルを作成する Excel

を使用する前に ファジー・ルックアップ オプションで、次の2つのデータ範囲を2つの異なるテーブルに変換する必要があります。

記事に続く "エクセルでの表の作り方" このようなテーブルにレンジを変換しています。

さて、これらのテーブルの名前を変更する必要があります。

のテーブルを選択します。 1月の販売実績 をクリックし テーブルデザイン タブ>> 名前を変更します。 テーブル名 かわりに 1月 .

同様に、名前を変更し 2月の販売実績 というテーブル 2月 .

Step-02:Fuzzy Lookup Excelアドインでファジー検索を作成する

➤へ移動します。 ファジー・ルックアップ タブ>> ファジー・ルックアップ オプションです。

今なら ファジー・ルックアップ の部分は、右ペインに表示されます。

⑭ 出力比較表を作成するセルを選択します。

➤ 選択してください。 左テーブル かわりに 1月 とのことです。 右のテーブル かわりに 2月 .

ここで、比較の基準となるカラムを選択する必要があります。 製品 の列と セールスパーソン カラムが選択されるように、これらのカラムは 左カラム 右カラム のボックスを使用します。

として 出力カラム を選択します。 1月.製品 1月.SalesPerson から 1月 テーブルとします。

2月.製品 2月.SalesPerson から 2月 テーブルと最後に

を選択します。 FuzzyLookup.Similarity(ファジィ・ルックアップ・シークラリティ は、類似性のパーセンテージ表示を得るためのものです。

このステップでは 試合数 かわりに 1 とのことです。 類似度閾値 かわりに 0.51 を押し、その後 行く .

このようにして、マッチングを得ることができました。 製品情報 アップル グリーンアップル に対して セールスパーソン ハワード とのことです。 チェリー , ブラックベリー そして トマト であるため、完全に一致する。 100% .

マッチング数および類似度しきい値の変更の効果

試合数 :

このオプションの選択次第で、最も多くのマッチングを得ることができます。

選択する場合 試合数 かわりに 1 ,

以下のような比較表が表示され、各製品に1つの類似性があることがわかります。 ブラックベリー で2回。 2月 の異なるテーブル。 営業担当者 .

しかし、選択すると 試合数 かわりに 2 ,

を選択すると、この2つのマッチング結果が表示されます。 ブラックベリー を搭載した製品があります。 セールスパーソン シェルドン マット .

類似度閾値 :

の間の範囲を持っています。 0 まで 1 で、低い範囲から高い範囲に行くには、部分一致から完全一致に移行します。

まずは 類似度閾値 0.1 .

ここでは、類似性を得るために 20% まで 100% .

選択する場合 類似度閾値 かわりに 0.4 ,

の類似性範囲です。 60% まで 100% .

を選択した時点で 類似度閾値 という範囲 0.84 ,

とすると、類似性の範囲は 90% まで 100% .

最後に、最も高いものを選択するために 類似度閾値 のように 1 ,

そうすると、類似性の範囲がここにあるように、完全に一致するものだけを取得することができます。 100% .

2.パワー・クエリー・ファジィ・マッチング・オプション

ここでは パワークエリ の代わりに,2つのデータ範囲の部分的なマッチングに使用します。 ファジー・ルックアップ オプションを使用します。

Step-01:2つのクエリを作成する

比較のため 製品 セールスパーソン の列があります。 1月 2月 この2つの範囲をクエリに変換して、販売記録を作成します。

➤へ移動します。 データ タブ>> テーブル/レンジから オプションを使用します。

では、その テーブルの作成 ウィザードが表示されます。

➤ データテーブルの範囲を選択します(ここでは、データテーブルのデータ範囲を 1月の販売実績 )

➤チェック テーブルにはヘッダーがあります オプションを選択し、 を押します。 よっしゃー .

その後 パワークエリ エディタが起動します。

➤ クエリの名前を次のように変更します。 1月 .

では、このデータを接続のみとしてインポートします。

➤へ移動します。 ホーム タブ>> 閉じる & 読み込む ドロップダウン>> Close & Load To オプションを使用します。

その後 インポートデータ のダイアログボックスが表示されます。

をクリックします ➤。 コネクションの作成のみ オプションを選択し、 を押します。 よっしゃー .

同様に、以下のようなクエリを作成します。 2月 データセットに対して 2月の販売実績 .

右側のペインに、2つのクエリの名前が表示されています。 1月 2月 を、このステップで作成しました。

関連コンテンツ VLOOKUP エクセルでの近似一致文字列(4例)

Step-02: ファジー検索Excelのためのクエリの組み合わせ

このステップでは、前ステップのクエリを組み合わせて、これらのクエリのデータをマッチングさせる。

➤へ移動します。 データ タブ>> データを取得する ドロップダウン>> クエリーの結合 ドロップダウン>> マージ オプションです。

その後 マージ ウィザードが表示されます。

➤ 1つ目のボックスのドロップダウンをクリックし 1月 オプションを使用します。

➤ 2つ目のボックスのドロップダウンを選択し、次に 2月 オプションを使用します。

その後、2つのクエリのカラムを選択するために、以下のボタンを押します。 CTRL を持っています。 左クリック をベースに、データマッチングを行いたいと考えています。

すると、見つかったのは 3列 分身 9列 .

類似の読み物。

  • ExcelでVLOOKUPを使って部分一致させる方法(4つの方法)
  • エクセル部分一致2列(4つの簡単な方法)
  • INDEXとMatchを使った部分一致の方法(2通り)
  • Excelで部分的にVLOOKUPを使用する(3つ以上の方法)
  • Excel VLOOKUPで最も近い一致を見つける(5つの例付き)

Step-03: ファジー検索Excelのファジーマッチングオプションを使用する

では、次に ファジィマッチング オプションは、完全一致の他に部分一致を行うために使用します。

➤ 確認してください。 ファジーマッチングを使用してマージを実行する オプションを選択し 類似性閾値 かわりに 0.5 を選択すると、このオプションが表示されます。

➤ 選択してください。 無視する場合 オプションと テキストパーツの組み合わせでマッチング オプションを使用します。

このステップでは 最大マッチング数 かわりに 1 を押して よっしゃー .

ここでは、マッチング数が従来の 3 まで 5 .

その後 パワークエリエイトエディタ ウィンドウに表示されます。

ここでは、最初の2列を 1月 クエリのカラムが 2月 クエリが隠されているため、これを拡張する必要があります。 2月 の欄があります。

➤表示されている記号をクリックします。 2月 .

➤ 選択してください。 拡大する オプションを選択し、 を押します。 よっしゃー .

これで、2つのクエリのマッチングが正しく表示されるようになりました。

類似度閾値の変更による効果

を変更すると 類似性閾値 から 0.5 まで 0.2 であれば、次のようになります。 8 にかわり 5 のマッチングを行います。

を押した後 よっしゃー というように、最初の行を除いて、他の行も部分的に似ていることがわかります。

選択する場合 類似性閾値 から 0.2 まで 1 であれば、次のようになります。 4 にかわり 8 のマッチングを行います。

そのため、今回は完全一致を無視したケースのみ結果を出しています。

関連コンテンツ Excel SUMIFで部分一致させる(3つの方法)

覚えておきたいこと

🔺 組み込みのルックアップ関数のような VLOOKUP機能 , HLOOKUP関数 は完全一致の場合に便利ですが、希望に沿った近似的なマッチングを見つけるには ファジー・ルックアップ Excelのアドインです。

🔺 ケースのマッチングで異なる結果を出すには、以下のようにします。 試合数 類似度閾値 のパラメータを必要に応じて変更することができます。

プラクティス部門

自分で練習できるように 実践編 という名前のシートに、以下のようなセクションを作成します。 実践編 .自分でやってください。

結論

今回は、その機能の使用方法について取り上げてみました。 ファジー・ルックアップ エクセルがお役に立てれば幸いです。 ご意見・ご質問がありましたら、コメント欄でお気軽にお寄せください。

Hugh West は、業界で 10 年以上の経験を持つ、非常に経験豊富な Excel トレーナー兼アナリストです。彼は会計と財務の学士号と経営管理の修士号を取得しています。ヒューは教えることに情熱を持っており、理解しやすい独自の教育アプローチを開発しました。彼の Excel に関する専門知識は、世界中の何千人もの学生や専門家がスキルを向上させ、キャリアで優れた成果を上げるのに役立ってきました。 Hugh はブログを通じて知識を世界に共有し、個人や企業が潜在能力を最大限に発揮できるよう無料の Excel チュートリアルとオンライン トレーニングを提供しています。