セマンティックスコア


セマンティックスコアは、タイトル、請求の範囲(出願時/付与時)、明細書等を機械学習で学習させた文書の特徴量により、キーワード、任意の文書または特定の特許文献の番号で類似度でスコアリングします。キーワードではなく予め学習させた単語の意味で類似度を計算するため、太陽電池とソーラーパネルといった似たような意味のキーワードが含まれる文書であれば、どちらも高い類似度になります。

セマンティック検索の機能とは違い、特許分類やキーワードで検索式を作った後の検索結果の母集団を絞り込まず類似度スコアのみが反映されます(ただし、計算量の関係上、検索結果が10万件を超える場合、類似度上位に絞り込まれます)。

探したい任意の自然文書または特定の文献から類似度が高い順にスコアリングすることにより、教師データなどを用意せずともすぐにお探しの技術内容に近い特許文献から調査することができます。

例えば、「検索エンジン」というキーワードで検索した場合、検索した母集団には、文書に含まれるキーワードの検索効率化に関するもの、画像の検索に関するもの、など様々な文献が含まれます。この母集団の中で、特に「動画検索の効率向上」に関するものを調べたい場合、セマンティックスコアの欄に「動画検索の効率向上」と入力することにより、この技術に関連する技術文献を効率的に調べることができます(検索例)。

セマンティックスコアは、詳細検索画面より設定することができます。検索方法の選択はセマンティック検索以外を選択して下さい。

1. 特徴量セレクトメニュー
セマンティックスコアの計算対象となる特徴量を選択します。「タイトル/要約/請求の範囲/明細書/審査官キーワード」または「タイトル/要約/請求の範囲」が選択できます。特に権利範囲である請求の範囲で似ているものを効率的に調べたい場合は、「タイトル/要約/請求の範囲」を選択してください。

2. セマンティックスコア条件入力フィールド
類似度計算の条件となるキーワード、文書または特許文献の番号を入力します。番号を入力する場合、出願番号の場合、AN:JP20010123456またはapp_id:JP20010123456と入力します。公開番号の場合、PN:~またはpub_id:~、特許番号の場合、EN:~またはexam_id:~を入力します。番号は複数入力することができます。なお、このフィールドでは論理演算式は使えません。

・フィルター併用時のセマンティック検索の考え方

https://assets.patentfield.com/static/semantic_filter.pdf