Semantic search


概要

AIセマンティック検索は、複雑な検索式を作成しなくても、探したい技術のキーワードや文章、特許番号を入力するだけで、簡単に類似の特許を検索できます。

AIセマンティック検索の特徴は、Patentfieldに収録されている膨大な特許公報のタイトル/請求の範囲/明細書/出願人/発明者等の情報がAIによって事前に学習されています。それにより、特許公報内に出現するキーワードの意味を学習しています。

 例えば、「ソーラーパネル」というキーワードは、「太陽電池パネル」や「太陽光発電パネル」と類似する意味として学習されており、「 ソーラーパネル」または「ソーラーパネル」を含む文書で検索すると、「太陽電池パネル」や「太陽光発電パネル」などが含まれる文書を検索することができます。

より詳細には、Patentfieldに収録されている公報は、AIによって関連する技術分野ごとに独自にクラスタリングされています。そのため、技術的に近い公報は同じ又は類似のクラスタに属することになります。AIセマンティック検索を実行すると、まず検索キーワードや文章等に近いクラスタを探し、技術的に近いクラスタを30個(オプション設定で変更可)抽出します。その抽出したクラスタの中から、検索キーワードに類似する上位の公報を抽出しています。そのため、技術的に近い公報が検索結果に表示されるようになります。

言葉の意味を加味してAIが検索してくれるので、検索キーワードや文章の意味に沿った結果が表示され、ユーザーの検索意図や目的に近い特許公報が上位に表示され、検索の効率化を図ることができます。

海外文献のセマンティック検索

AIセマンティック検索は、日本語・英語に対応しており、例えば英語でキーワード入力した場合は、US/EP/WO(英語のみ)の文献について、類似公報を検索することができます。

日本語のキーワードや、日本語で記載された公報番号(JP/WO)を入力した場合は、日本語公報しかヒットしません。
英語のキーワードや、英語で記載された公報番号(US/EP/WO)を入力した場合は、英語公報しかヒットしません。

類似キーワードの検索

なお、AIがどのようなキーワードを類似する意味として学習しているかをPatentfield内で確認することができます。「詳細検索画面」の「類似キーワード」で、キーワードを入力すると、そのキーワードと類似する意味合いをもつキーワードを検索することができます。


公報番号によるAIセマンティック検索

出願番号、公開/特許番号を入力することで、入力した特許番号に類似する特許を検索することができます。番号を入力した際には、その公報の「タイトル/要約/請求の範囲/明細書/審査官キーワード」の全文が入力されたものとみなします。

番号入力の際は、下図のような番号形式で入力すると候補となる公報番号がサジェストされますので、表示された公報を選択することで、入力が可能です。
入力サジェストの機能については、こちらをご参照ください。

なお、公報番号で検索する際には、下記2パターンの入力方法に対応しています。

JP201000012345  #公報番号のみを入力
app_id:JP201000012345  #app_id:で指定する

なお、番号の後に@CLをつけることにより、入力した公報番号の「請求の範囲」と類似する文献を検索することもできます。比較対象は、選択した対象特徴量により公報のどの部分と比較するかが変わります。詳細は、上部スライドのP5を参照ください。

app_id:JP20090253196@CL


複数の公報番号を入力した検索方法

複数の公報番号を入力してAIセマンティック検索を行うこともできます。複数の公報番号を入力する場合は、下記例のように、スペースを空けて入力します。公報番号は、「app_id」「pub_id」等をつけずに、単純に番号を入力するだけでも検索が可能です。

app_id:JP20090253196 app_id:JP20100123456
JP20090253196 JP20100123456

複数の公報番号を入力した場合は、2つの公報の全文を合成した文章として、類似する特許文献を検索します。

特徴語抽出

文章又は公報番号を入力後、右クリックで「特徴語抽出」を選択すると、入力文章又は公報全文から特徴キーワードとスコアを抽出して表示させることができます。
「特徴語抽出」の横にある数字をプルダウンから選択すると、抽出する特徴キーワードの数を変更することができます。

抽出された特徴キーワード&スコアをカスタマイズして、特徴キーワードを自由に追加・削除したり、スコアの重み付けを変更することができます。カスタマイズして検索を実行すると、カスタマイズした内容に基づいてAIセマンティック検索を行うことができます。


サブキーワード

AIセマンティック検索の検索結果で、類似概念を広くとらえすぎていてノイズが多いと感じる場合は、下図の赤枠内のフィールドに、文書に現れるキーワードを補助的に追加して下さい。
サブキーワードのフィールドにキーワードを入力すると、まず「サブキーワードに入力されたキーワード」で全文検索が実行されて、全文中にそのキーワードが含まれる母集合が作成され、その母集合の中でセマンティック検索が実行されます。


フィルター(詳細)内でのAIセマンティック検索
詳細検索画面の「フィルター(詳細)」で、セマンティック検索のフィルターを追加することもできます。フィルター内でのセマンティック検索により、全文検索コマンド検索結果で絞り込んだ母集合に対し、セマンティック検索の類似度順でソートすることもできます。

AIセマンティック検索とフィルター(詳細)を併用して使用する場合は、入力フィールドによって、論理演算の優先順位がありますのでご注意ください。優先順位の適用によって、想定している検索結果にならない可能性があります。詳細については、よくある問合せの「Q.セマンティック検索で作成した母集合に対して、フィルターをかけるにはどうすればいいでしょうか?」をご参照ください。
 
フィルター併用時のセマンティック検索の考え方

https://assets.patentfield.com/static/semantic_filter.pdf

セマンティック検索オプション

件数:セマンティック検索後の母集合の最大件数(デフォルトでは10,000件です。)
検索クラスター数:セマンティック検索する際に自動的に抽出する集合(クラスタ)数
検索ワード数:セマンティック検索する際に自動的にOR検索に使うワード数
検索IPC数:セマンティック検索する際に自動的に使うIPC数
IPC種別:自動的に使うIPCの種類(サブクラス、メイングループなど)