AI教師ラベル一括読み込み手順


このページは、AI教師ラベルを一括読み込みする手順に関する説明です。AIラベル設定画面の説明はこちらをご参照ください。

1. 教師データとして分類済み番号リストを用意

まず、以下のような1列目に番号、2列目に任意のラベル名を付与した番号リストを用意します。多値分類の場合、任意のラベル名、2値分類の場合、1か-1を付与します。カンマ区切りかタブ区切り、どちらでも構いません。

サンプル教師データファイル

番号フォーマットは複数サポートしており、特願2001-1、特開2004-123456、特許6123456などが使えます。お持ちの番号フォーマットが対応していない場合はお問い合わせ下さい。

JP20060290111 # EPODOC形式出願番号(JPYYYYNNNNNNN),多能性幹細胞
特願2010-122389 # 特願形式(特願YYYY-N),多能性幹細胞
WO2013176233 # WO形式,多能性幹細胞
特許5544573 #特許番号形式(特許NNNNNN),ネットワーク・システム
特開2016-144034 #特開形式(特開YYYY-N) ,ネットワーク・システム
特開平11-204878特開平9-53681 #特開形式(和暦:特開平Y-N),光学
2008-288035 #特願、特開が識別不能な場合、クエリ種別で選択中のものになる,光学
2099-123456 #データベースに存在しない番号,光学
特開2017-92183 #特願、特開形式は0省略可能,光学
【解決手段】本発明は、樹脂に配合された際に、樹脂の機械的強度増強に寄与するミクロフィブリル化セルロース及びこれを含有してなる複合化樹脂に関するものである。より具体的には、本発明のミクロフィブリル化セルロースは、シランカップリング剤処理によって表面改質されたミクロフィブリル化セルロースである。また、本発明の樹脂は前記の表面改質されたミクロフィブリル化セルロースを含有する樹脂である。さらに、本発明の製造方法は、前記の表面改質されたミクロフィブリル化セルロースを製造する方法である。,化合物,t
JP20090132707,化合物
JP20170559255,化合物
JP20170563865,ネットワーク・システム

2. 分類済み番号リストを入力

上部検索ボタン横のAIボタンより、AIラベル設定画面を開きます。


3. 分類種別を選択

用意した教師ラベルに応じて分類種別を選択します。独自の技術分類など複数のラベル名の場合は、多値分類、興味のある文書(1)か検索ノイズであるか(-1)である場合は2値分類を選択して下さい。


4a. 教師ラベルを一括インポート(コピー&ペーストの場合)

エクセルなどで1列目に番号、2列目に教師ラベルが付与されたものを開き、1列目と2列目をコピーします。次に、AIラベル設定の画面で教師データを一括編集のボタンをクリックします。


その後、教師データ入力欄に教師番号リストをペーストし、教師データを保存ボタンをクリックします。

以下の図のように右側に番号とラベル名が付与されていれば、正しく教師ラベルが読み込めています。ビックリマークがあるものはデータベースに存在しない番号です。フォーマットに誤りがないか等を確認して下さい。


4b. 教師ラベルを一括インポート(ファイル読み込みの場合)

カンマ区切りまたはタブ区切りで1列目に番号、2列目に教師ラベルが付与されたテキストファイルを用意します。エクセル形式はサポートしていませんので注意してください。CSVかTSVの形式である必要があります。次に、AIラベル設定の画面でファイルから読み込みをクリックします。出現したファイルを選択ボタンをクリックしてファイルを選択するかドラッグ&ドロップをしてください。
なお、テキストを教師にする場合は、3列目にtと入力する必要があることに注意してください。3列はクエリ種別を設定する欄であり、出願番号はa、公開番号はp、登録番号はe、テキストはtになります。番号の場合は、自動判別可能な番号フォーマットの場合は3列目は省略可能です。



5. 未分類の番号リストを用意

以下のような1列目に予測したい番号を付与した番号リストを用意します。原則、2列目は不要ですが、教師番号のリストと同様に2列目にラベルを付与することも可能です。この場合、AIが予測した結果との精度検証に用いることができます。

サンプル予測データファイル

特開平7-149737
特開平7-165579
特開2002-78792
特開2018-163436
再表2017-104724
特開2018-151775
特開2018-145113
特開2018-141892
特開2018-143025
特開2006-276388

6. 予測データの入力画面へ切り替え

予測データに切り替えより予測データ入力画面に切り替えます。

7. 予測番号リストを一括インポート

予測番号リストを教師ラベルと同様に一括編集かファイルから読み込みでインポートします。その後、予測データで検索ボタンでクリックして下さい。

なお、読み込んだ番号リストを対象として予測した結果を得るには、予測データ画面の「予測データで検索」ボタンの方であることに注意してください。教師データ入力画面の場合は、詳細検索画面にて任意の検索式または番号を一括入力での母集団で予測することができる「検索結果で予測」ボタンであり、予測データ画面で入力した番号リストの母集団とは異なります。


8. 予測結果一覧をエクセルでダウンロード

検索結果画面のAI予測ラベルの欄にAIが教師データが学習した結果が表示されます。検索結果画面の右上のエクセルボタンによりAI予測ラベルを含む検索結果をエクセルまたはCSV形式でダウンロードすることができます。出力項目はカスタマイズ可能です。エクセルエクスポート時には、AI予測ラベル候補、AI予測ラベル候補スコアを選択することができ、上位5つの予測ラベル候補とスコアを確認することができます。

500件以上の場合は、サーバー上でダウンロード処理が進行し、ダウンロード完了のメッセージが到着するとマイアカウントページからダウンロードすることができるようになります。なお、1000件を超える一括ダウンロードはオプションとなっていますので、必要な場合はお問い合わせ下さい。



9. 教師データ番号リストの切り替え

AIラベル設定画面の右上の予測モデルより、教師データ番号リストを切り替えることができます。複数種類の異なる教師データの番号リストを管理することができます。作業グループを追加を選択すると新しい教師データ番号リストのセットを追加することができます。教師データは10種類まで保存することができます。オプションで種類数を増やすこともできます。種類数が必要な場合は、お問い合わせ下さい。