4
NTT技術ジャーナル 2017.4 46 AIの深化とIoT時代の到来 AI(人工知能)が最初に登場したのは,20世紀半ばで, 2度のブームを経て,今世紀に入って登場した深層学習 (ディープラーニング)技術とともに,3度目のブームを 迎えています. 時期をほぼ同じくして,これまでICTとかかわりの薄 かったさまざまな分野のモノがネットワークに接続し,さ まざまなデータが大量に得られるようになりました.この IoT(Internet of Things)時代の到来とともに,ICTが 取り扱うデータは,量的な増大に加え,データの非構造化 といった質的な変化が一層進んでおり,従来とは異なる処 理,活用の技術が強く求められています. データ解析へのAIの適用 IoT時代におけるデータ解析技術のうち,量的な増大に 対するものとしては,ビッグデータ解析などが挙げられま す.一方で質的変化は,その多種多様さから,共通の統一 的なルールで解析をすることは困難であり,人間による個 別の判断が必要になります. しかし,データの指数関数的な増大,生産年齢人口の減 少という状況下にあって,そのような作業に人手を確保し 続けることは,現実問題として困難です. NTT西日本研究開発センタでは,人間に代わって大量 の判断を行う主体としてAIに着目し,将来的な活用を見据 え,適用性の見極めと知見の蓄積に取り組んでいます.こ こでは,その取り組み事例について紹介します. AIを用いたデータ解析の取り組み ■映像解析によるメタデータ生成の取り組み IoT時代の到来とともに,さまざまなセンサをネット ワークに接続してデータを収集する技術の開発が進められ ていますが,電力の確保や保守といった克服すべき課題は まだ多く残されています. 一方でさまざまなセンサと接続されたネット空間には, 従来にも増して膨大な映像データが蓄積されています.ブ ロードバンドの浸透により,従来から,エンタメ系コンテ ンツ,個人投稿映像などの流通は活発ですが,IoT時代と なり,これらに加え,防犯カメラ映像,ドライブレコーダ 映像,ドローンで撮影した映像など,映像データの量と種 類がますます増えてきています. 人間は外界の状況理解の大半を視覚に依存していること から,映像データにはマルチセンサとしての潜在的な情報 量があると考えられます.すなわち,ネット空間上の多種 多様な映像データを分析 ・ 活用することは,人間の日常生 活や企業活動に快適さ,効率を提供でき,ビジネス的な観 点も含め,大きな意義があります. さまざまなシーンで映像データを効率的に管理し,便利 に活用し,ネット上での流通を促進するためには,映像デー タに対し,映像内容の特徴を記述するメタデータ(タグな ど)を付与する必要があります.そのためNTT西日本研 究開発センタでは,AIを用いた映像データの解析により, 効率的なメタデータの付与を実現するための技術開発に取 り組んでいます(図₁). 研究開発センタで開発した映像解析システムは,画像認 識,文字認識,音声認識,自然言語処理の4つの要素技術 により構成されています. 画像認識技術は,映っているオブジェクト,人物,ロゴ など,文字認識技術はテロップや看板などに映っている文 字情報,音声認識技術は登場人物の音声やナレーションな どを,それぞれ認識し,テキスト情報として出力します. 自然言語処理技術は,文字認識および音声認識の結果の テキスト情報の中から,重要なキーワードを自動抽出し ます. f rom NTT西日本 NTT西日本研究開発センタにおけるAIを用いた データ解析の取り組み IoT(Internet of Things)時代の到来とともに,ICTが取り扱うデータには,多種多様なセンサ情報など,量の爆発的な増 加に加え,データの非構造化が一層進んでいます.NTT西日本研究開発センタでは,このようなデータの量・質の大きな変化 に対し,人間に代わって大量の判断を行う主体としてAI(人工知能)に着目し,その適用性の見極めと知見の蓄積に取り組んで います.ここでは,その取り組み事例について紹介します.

04 11 FromNTT - ntt.co.jp · aiの深化とiot時代の到来 ai(人工知能)が最初に登場したのは,20世紀半ばで, 2度のブームを経て,今世紀に入って登場した深層学習

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 04 11 FromNTT - ntt.co.jp · aiの深化とiot時代の到来 ai(人工知能)が最初に登場したのは,20世紀半ばで, 2度のブームを経て,今世紀に入って登場した深層学習

NTT技術ジャーナル 2017.446

AIの深化とIoT時代の到来

AI(人工知能)が最初に登場したのは,20世紀半ばで,2度のブームを経て,今世紀に入って登場した深層学習

(ディープラーニング)技術とともに,3度目のブームを迎えています.

時期をほぼ同じくして,これまでICTとかかわりの薄かったさまざまな分野のモノがネットワークに接続し,さまざまなデータが大量に得られるようになりました.このIoT(Internet of Things)時代の到来とともに,ICTが取り扱うデータは,量的な増大に加え,データの非構造化といった質的な変化が一層進んでおり,従来とは異なる処理,活用の技術が強く求められています.

データ解析へのAIの適用

IoT時代におけるデータ解析技術のうち,量的な増大に対するものとしては,ビッグデータ解析などが挙げられます.一方で質的変化は,その多種多様さから,共通の統一的なルールで解析をすることは困難であり,人間による個別の判断が必要になります.

しかし,データの指数関数的な増大,生産年齢人口の減少という状況下にあって,そのような作業に人手を確保し続けることは,現実問題として困難です.

NTT西日本研究開発センタでは,人間に代わって大量の判断を行う主体としてAIに着目し,将来的な活用を見据え,適用性の見極めと知見の蓄積に取り組んでいます.ここでは,その取り組み事例について紹介します.

AIを用いたデータ解析の取り組み

■映像解析によるメタデータ生成の取り組みIoT時代の到来とともに,さまざまなセンサをネット

ワークに接続してデータを収集する技術の開発が進められていますが,電力の確保や保守といった克服すべき課題はまだ多く残されています.

一方でさまざまなセンサと接続されたネット空間には,従来にも増して膨大な映像データが蓄積されています.ブロードバンドの浸透により,従来から,エンタメ系コンテンツ,個人投稿映像などの流通は活発ですが,IoT時代となり,これらに加え,防犯カメラ映像,ドライブレコーダ映像,ドローンで撮影した映像など,映像データの量と種類がますます増えてきています.

人間は外界の状況理解の大半を視覚に依存していることから,映像データにはマルチセンサとしての潜在的な情報量があると考えられます.すなわち,ネット空間上の多種多様な映像データを分析 ・ 活用することは,人間の日常生活や企業活動に快適さ,効率を提供でき,ビジネス的な観点も含め,大きな意義があります.

さまざまなシーンで映像データを効率的に管理し,便利に活用し,ネット上での流通を促進するためには,映像データに対し,映像内容の特徴を記述するメタデータ(タグなど)を付与する必要があります.そのためNTT西日本研究開発センタでは,AIを用いた映像データの解析により,効率的なメタデータの付与を実現するための技術開発に取り組んでいます(図₁).

研究開発センタで開発した映像解析システムは,画像認識,文字認識,音声認識,自然言語処理の4つの要素技術により構成されています.

画像認識技術は,映っているオブジェクト,人物,ロゴなど,文字認識技術はテロップや看板などに映っている文字情報,音声認識技術は登場人物の音声やナレーションなどを,それぞれ認識し,テキスト情報として出力します.

自然言語処理技術は,文字認識および音声認識の結果のテキスト情報の中から,重要なキーワードを自動抽出します.

from NTT西日本

NTT西日本研究開発センタにおけるAIを用いたデータ解析の取り組み

IoT(Internet of Things)時代の到来とともに,ICTが取り扱うデータには,多種多様なセンサ情報など,量の爆発的な増加に加え,データの非構造化が一層進んでいます.NTT西日本研究開発センタでは,このようなデータの量・質の大きな変化に対し,人間に代わって大量の判断を行う主体としてAI(人工知能)に着目し,その適用性の見極めと知見の蓄積に取り組んでいます.ここでは,その取り組み事例について紹介します.

Page 2: 04 11 FromNTT - ntt.co.jp · aiの深化とiot時代の到来 ai(人工知能)が最初に登場したのは,20世紀半ばで, 2度のブームを経て,今世紀に入って登場した深層学習

NTT技術ジャーナル 2017.4 47

抽出されたキーワードは,映像に関するメタデータとしてほかのパラメータ(時刻など)とともにデータベースに登録され,各シーンの特徴を表す情報として参照することが可能です.

今回開発したシステムでは,背景雑音が小さい状況において,高い精度でメタデータを付与することが可能となっています.今後は,背景雑音が大きく,複数人の発話が行われているなど対象の特定が難しい状況におけるメタデータ付与の精度向上に向け,引き続き取り組んでいきます.■画像解析による不良設備検出に向けた取り組み

電柱,電線などの不良設備検出に関する取り組みの多くは,レーダなどの高価なセンシングデバイスや専用の解析装置を用いて行われます.

研究開発センタは,前述のように画像が持つ情報量の潜在力に着目し,デジタルカメラなどの比較的安価なデバイスによって取得される画像を,AIを用いて解析することにより,不良設備を検出する技術の開発に取り組んでいます

(図₂).具体的には,次のプロセスを実施し,不良設備を検出し

ます.①  デジタルカメラを搭載した社用車により屋外通信設

備(電柱など)の画像を収集する.② 収集した画像を解析し,対象設備を選別する.③  選別された設備の中で,保全対応が必要な不良設備(傾きやヒビの存在する電柱など)の判別と場所の特定を行う.

AIを用いた解析は,②③にて実施します.②の過程においては,屋外通信設備選別のための特徴量

の設定と改良を,専門技術者によって実施する手法ではなく,自律的に特徴量を抽出する深層学習を適用し,NTT西日本設備の認識精度向上に取り組んでいます.

③の過程においては,保守が必要な電柱を判定する際に,経年変化も考慮しながら,設備保全の品質向上を図ることをめざしています.例えば,ある日とその数カ月後において,ある同一の電柱の傾きがほかよりも大きくなるようなものは詳細なチェックを行うといった,予防保全観点での活用が想定されます.

②と③のプロセスにおいてはAIによる判定結果に対し,

ICTを使ったテクノロジを使ったお化け屋敷でございます

「うわっ!」とビックリする動きを加速度センサでとらえて「うわっ!」とビックリする動きを加速度センサでとらえて

図 1  映像解析によるメタデータ生成

文字認識

画像認識①データ抽出

②メタデータ生成 … … …

③高度な活用(検索・表示)

各認識結果の統合

データベースへ登録

データベース  映像データ

+メタデータ

お化け屋敷 検索関連シーンのみ抽出

映像解析結果

・梅田・お化け屋敷・NTT

各認識結果の統合

データベースへ登録

映像解析結果

・ICT・テクノロジ・お化け屋敷

各認識結果の統合

データベースへ登録

映像解析結果

・ハート・ビックリ・加速度センサ

想定事業例:

放送事業者等向け映像管理ツールとして提供

音声認識 音声認識音声認識

画像認識

文字認識文字認識

Page 3: 04 11 FromNTT - ntt.co.jp · aiの深化とiot時代の到来 ai(人工知能)が最初に登場したのは,20世紀半ばで, 2度のブームを経て,今世紀に入って登場した深層学習

NTT技術ジャーナル 2017.448

技術者がチェックを行い,その結果を教師データとしてフィードバックを行うことで不良設備発見の精度向上を図っています.現在までに,電柱以外の建造物が少ない地域においては,ある程度高い精度で対象設備の認識が可能となっています.

本取り組みにおける画像取得装置にはデジタルカメラなど普及品を用いるため,初期導入は安価に抑えられます.また,所外設備保全をミッションとして持つグループ会社と連携してフィールドトライアルを実施しており,設備保守技術者が日常業務で用いる社用車から画像を取得するため,画像取得のための大きな追加稼働は発生しません.

本取り組みにより,画像解析による不良設備発見が実現すれば,保全業務全体にかかるコストの大幅な削減と効果的な予防保全が可能となり,ひいては安心 ・ 安全 ・ 信頼といったサービス価値向上への貢献が期待できます.

今後は,実フィールドにおける事例の蓄積により,都市部における対象設備の認識精度向上に引き続き取り組んでいきます.

■農業の生産性向上に向けた取り組み日本における農業は,農業従事者の高齢化,後継者不足

による担い手の減少により,生産性の向上という課題に直面しています.農業の生産性における大きな課題として,農作物がいつどれくらい取れるかの予測(収穫量予測)が困難であることが挙げられ,収穫期における稼働のムリ ・ムラ ・ ムダや,出荷量をコントロールできないことによる値崩れなどの問題が生じています.

農作物の収穫量予測に関する研究はこれまでにも行われており,一部の葉物野菜(レタスなど)においては,生育環境データ(温度,水,肥料,日照など)を正確に収集できると,高精度な予測が可能となることが分かっています.しかし,果菜類(トマトなど)においては,その予測は有効ではなく,篤農家の勘と経験による収穫量予測が中心となっているのが現状です.

研究開発センタでは画像解析技術 ・ AI技術を用いることで,篤農家が収穫量予測を行っている “頭脳” と,その判断の根拠となる “感覚” を再現し,収穫量予測のシステム化とさらなる精度向上に取り組んでいます(図₃).

図 2  画像解析による不良設備検出

❶対象物のデータ収集・映像データ(カメラ)・位置データ(GPS)・車両傾きデータ(ジャイロセンサ)

❷データ解析・電柱認識(Hough変換,深層学習)・傾き計測・ひび検出

❸解析データ活用・地図へのマッピング

意識せず走行するだけで情報収集

ひび検出傾き計測

将来的には道路設備全般の保全業務実施

NTT西日本from

Page 4: 04 11 FromNTT - ntt.co.jp · aiの深化とiot時代の到来 ai(人工知能)が最初に登場したのは,20世紀半ばで, 2度のブームを経て,今世紀に入って登場した深層学習

NTT技術ジャーナル 2017.4 49

まず,収穫前の果実をカメラで定期的に撮影し,一連の画像データを蓄積します.篤農家によってそれらの果実が収穫されると,その収穫日をもって一連の画像データに収穫までの日数を付与します.AIに,この収穫までの日数が付与された画像データを与えることで,画像の特徴と収穫までの日数の関係性を学習させます.こうした学習を繰り返し実施することで,AIによる,収穫日を与えられてない果実の画像を基にした収穫までの日数推測,さらには収穫量予測の実現をめざしています.

また,果菜類の収穫時期はその果実に含まれる成分などにも影響を受けます.研究開発センタでは特殊なカメラを用い農作物に含まれる成分と相関の高い情報を取得することにより,収穫量予測のさらなる精度向上にも取り組んでいます.

この技術の検証には,収穫前の果実の画像が多数必要です.2016年度は千葉県と熊本県のトマト農家の協力を得て,フィールドでの実証実験を行っています.本実証実験では,約1カ月にわたり圃場のトマトを撮影し,撮影された数千枚のトマト画像をAIに学習させ,収穫量予測を試みています.

今後は,実運用に向けたトライアルを実施し,さまざま

な農作物への適用性検討や,他分野への応用に向けた技術確立を継続し,農業分野における高齢化 ・ 後継者不足などの課題に取り組んでいきます.

今後の展開

AIを用いたデータ解析の取り組みは,まだ着手したばかりです.今後は,社内外のパートナーと連携し,さまざまなユースケースへの適用を通じて技術的な知見を蓄え,総合生活基盤としての情報通信サービスを支える研究開発に取り組んでいきます.

◆問い合わせ先NTT西日本 技術革新部 研究開発センタ 開発推進担当/ユーザサービス担当/コミュニケーションサービス担当TEL 06-4792-8404E-mail ks-jimu-rdc west.ntt.co.jp

UP!!

収益向上

データ取得

予測データ

解析

 図 3  農業の生産性向上に向けた取り組み 

3

61

5

4 10

9

13 12

7

8 3

日 月 火 水 木 金21

土3

4 5 6 7 8 9 10

11 12 13 14 15 16 17

18 19 20 21 22 23 24

25 26 27 28 29 30

3

61

5

4 10

9

13 12

7

8 3

日 月 火 水 木 金21

土3

4 5 6 7 8 9 10

11 12 13 14 15 16 17

18 19 20 21 22 23 24

25 26 27 28 29 30

3

61

5

4 10

9

13 12

7

8 3

日 月 火 水 木 金21

土3

4 5 6 7 8 9 10

11 12 13 14 15 16 17

18 19 20 21 22 23 24

25 26 27 28 29 30