2018年11月26日
理研と東大「正信頼度データから未知データ取得」
【カテゴリー】:新製品/新技術
【関連企業・団体】:理化学研究所

理化学研究所と東京大学の研究チームは26日、人工知能(AI)を用いた、データを正と負に分ける機械学習の分類問題で、正のデータとその信頼度(生信頼度)の情報だけから、分類境界を学習できる手法を開発したと発表した。
これまで負のデータを収集できないという理由で分類技術が用いられてこなかった多くの分野で、今後、正信頼度の情報に基づく分類技術やAI利用が拡大すると期待できる。

一般に機械学習の分類技術を用いるには、正と負の両方のデータを収集する必要があるが、実世界では正のデータしか手に入らず、負のデータを収集できない場合が多い。例えば、購買予測では、顧客が過去に自社商品を購入した例(正のデータ)は集められるが、ライバル商品を購入した例(負のデータ)は集められない。

このような分類問題に対して、これまでコンピュータは学習できなかった。今回、研究チームは、たとえ正のデータしかなくても、それに対する信頼度(正信頼度)の情報さえあれば、分類境界を学習できる手法を確立した。

同研究は来月3日からのカナダでの国際会議「Neural Information Processing Systems(NeurIPS 2018)」での発表に先立ち、NeurIPS 2018のウェブサイトで公開(11月23日)された。