日本株式會社PFUとPFU上海計算機有限公司が共同開発した【ディープラーニング環境音認識システム】は、IEEEが指定する國際大會DCASE 2018 ChallengeのTask 4のコンテストに參加し、50システムの中で一位を獲得しました。
DCASE 2018 Challengeは、IEEEによって指名されたAASP (Audio and Acoustic Signal Processing) Challengeコンテストの一環で、IEEEによって公認された音聲?音響信號処理の國際的な権威あるコンテストでもあります。Task 4は“Large-scale weakly labeled semi-supervised sound event detection in domestic environments”、つまり“室內環境における大スケール弱ラベル半監督音事象検出”です。今年のコンテストの內容は與えられた室內環境中の音聲(人の聲、貓や犬の鳴き聲、警報音、掃除機の音、ひげをそる音、食べ物を揚げる音などが含まれる)のうち、何秒目から何秒目までのどのような音があるかを認識するものでした。
PFU上海チームはこのコンテストに參加し、北京清華大學、中國科學技術大學、上海交通大學など國內の名門大學以外、米ジョンズ?ホプキンス大學、オーストリア?グラーツ大學、韓國電子通信研究院、インド工科大學など海外の研究機関が參加した同大學とのコンテストで1位を獲得しました。正解率は2位より2.5%高く、基準より21.6%高くなっています。
近年ディープラーニング(深層學習)技術が急速に進展しているため、PFU上海チームは常に最先端技術の変化に注目し、それらの研究と運用を通じて、ニューラルネットワーク技術について豊富な経験を積んでおり、高い実踐力を備えています。今回のコンテストでは、PFU上海チームはさまざまなニューラルネットワーク技術に関する長年の研究経験を活かし、音聲処理に最適なニューラルネットワークのアルゴリズムを正確に選び出し、音聲の音響的特徴を抽出する精度を高め、最終優勝のための強固な基盤を築き上げた。さらに、従來モデルでは扱うことができなかった弱いラベルデータに、従來モデルでは扱うことができなかった弱いラベルデータを訓練するための様々な最先端の新しいモデルに挑戦し、コンテキスト相関技術によって音響的特徴をさらに強化することで、これらの新しい技術の応用に新しいブレークスルーをもたらしました。
PFU上海チームは今後もAI分野に深く関與し、挑戦を続け、新たなピークを目指します。