映像に自然な音をつける技術 ~用途と技術例~

アイキャッチ画像

はじめに

こんにちは、2020 年入社のプロダクト開発部に所属しております、渡邉です。このたび新卒研修の課題として「動画から自然な音をつける技術」というテーマで技術調査を行い、その結果をこのようにブログという形でアウトプットすることになりました。ここでは技術の詳細には立ち入らず、「この技術が現在どれぐらいの精度が出ており、現在あるいは将来的にどのような場面に応用できそうか」という点を中心に議論していきたいと考えています。どうぞよろしくお願いします。 続きを読む 映像に自然な音をつける技術 ~用途と技術例~

説明可能AIが社会から必要とされる理由、その研究動向・応用事例について

はじめに

こんにちは。2020年4月に新卒として入社した、データソリューション本部の森西です。新卒研修の技術調査課題で調査した結果についてブログを執筆します。 この課題では、設定された10個の技術的テーマからそれぞれ好きなテーマを選択し、4日間かけて調査した結果をまとめました 。私は、10のテーマの中で「Explainable AIに関する技術調査」を選択し、今回はそのまとめた内容について紹介します。

Explainable AIについて

まず初めに、Explainable AIについて説明します。Explainable AIとは、その言葉通り、予測結果や推定結果に至るプロセスが人間によって説明可能になっている機械学習モデル、あるいはそれに関する技術や研究分野のことを指します。(引用元:AI・機械学習の用語辞典 XAI(Explainable:説明可能なAI) /解釈可能性(interpretability)とは?[23])

昨今では、AI(機械学習)の技術発展に伴い、社会実装の期待が高まっています。 一方でそれらの技術に対して不安も増加しています。その背景として、AI(機械学習)の中身の技術が非常に複雑で「ブラックボックス」となっており、AI(機械学習)の予測結果や推定結果に対する説明が十分ではないことが理由として挙げられます。医療分野など、AI(機械学習)の予測結果や推定結果に理由を求める分野も存在し、説明可能なAI(機械学習)を求める社会的機運は高いと考えられます。

本ブログでは、Explainable AIについて社会的に求められるようになった背景、最近の研究動向、応用例、展望について述べていきます。

続きを読む 説明可能AIが社会から必要とされる理由、その研究動向・応用事例について

[2020新卒入社]株式会社ALBERTに入社しました

こんにちは!
2020年4月に新卒として入社した小林です。

今年は新型コロナウイルスの影響で入社式が無くなり、研修はほとんどオンラインでの研修となり、新入社員、そして研修を用意する講師陣にとって怒涛の2ヶ月間でした。

また、 2020年の新入社員は計29名が入社し、例年に比べ大人数であったため研修準備も二重、三重に大変だったのではと思います。
2020/04/01 松本社長のメッセージを新入社員29名で視聴しています
松本社長の新入社員へのメッセージを視聴した4月1日を境に、研修がオンラインに移行しました。新入社員全員分のポケットWi-Fiを用意済みであるなど、オンラインへの対応の速さに驚いた記憶があります。

オンライン研修が決まった当時は、大学生気分である自分をオフィスで鍛え上げて欲しかったので、複雑な心境でした(もちろん、素晴らしい判断だと思います)。

しかし、その不安も忘れるような密度の濃い研修を受けることができました。

これから、今年行ったオンライン研修についてご紹介します。
ALBERTに興味がある方、あるいはオンライン研修について気になる方はぜひ読んでいただけると幸いです。 続きを読む [2020新卒入社]株式会社ALBERTに入社しました

チャットボットは個性を獲得できるのか?

はじめに

こんにちは。プロダクト開発部の飯田です。

2020年に新卒として入社し、AIチャットボット「スグレス」をはじめとした、自然言語処理の研究開発に取り組む予定です。

スグレスはユーザーの要望に的確に回答できるチャットボットで、対話の内容はクライアント毎に調整します。

たとえば弊社のコーポレートサイトに設置されたスグレスでは、電話番号や所在地といった会社概要のほか、採用情報や事業内容に至るまで、弊社に関連する事項を幅広く回答します。

おすすめは弊社の扱う技術要素について尋ねることです。ディープラーニングやクラスター分析など、名前はよく聞くけれども複雑で難しい……という様々な手法について、大変わかりやすく教えてもらえるので、私も頻繁にスグレスの力を借りています。

そんなスグレスですが、その口調は一貫して事務的で丁寧です。現在は質問に対する回答を返すことを目的としたシステムなので問題はありませんが、より汎用的なAIチャットボットとしての進化を考えると、TPOに応じて口調を変えられると夢が広がるでしょう。

個人的に欲しいのは、メールやSNSの返事を代筆してくれる機能です。人間関係の距離感は難しいので、どれだけ丁寧にするか、くだけた口調にするか、私はよく迷うのですが、そうした判断をスグレスに助けてもらえれば心にゆとりが生まれます。

そこでチャットボットに個性を与える研究が実現できないか?と考え、まずは世界の最先端がどこにあるのかとサーベイを行いました。本記事ではその調査結果についてまとめます。

続きを読む チャットボットは個性を獲得できるのか?

FAQ 検索の精度改善の取り組みについての紹介

こんにちは。プロダクト開発部で弊社の AI・高性能チャットボット「スグレス」の開発および自然言語処理の R&D をしている中井です。

チャットボットとは、「チャット」と「ボット」を組み合わせた言葉で、人工知能 (AI) を組み込んだコンピューターが人間に代わって一定の会話を自動化する「自動会話プログラム」のことです。スグレスは人工知能 (AI) を搭載した高性能チャットボットサービスです。

スグレスには Frequently Asked Question (FAQ) 検索と呼ばれる、ユーザーが入力したメッセージ (以下、クエリと呼ぶ) から、適切な回答候補を推測する機能があります。

今回は、FAQ 検索の精度改善の取り組みについて紹介します。 続きを読む FAQ 検索の精度改善の取り組みについての紹介

動画認識手法の紹介とキャプション生成手法Masked Transformerについての解説

はじめに

こんにちは、プロジェクト推進部の水船です。前の記事でもご紹介した先進技術WGでは今、動画分析を重要テーマとして調査しています。今回は2018年に提案された手法で少し古いですが、Masked Transformer [1]という動画キャプション生成モデルについての解説をしていきます。またそれに関連して、動画認識のための諸手法についてもざっくりと紹介します。Masked TransformerのPyTorch実装も公開しているのでご覧ください。 続きを読む 動画認識手法の紹介とキャプション生成手法Masked Transformerについての解説

三次元空間のニューラルな表現とNeRF

はじめまして、先進技術部の山内です。入社4年目にしてついに技術ブログを書くことになりました。わたしが文章を書くとどうもペダンティックな文体になりがちなのですが、頑張って書いたので気に食わない表現には適宜目を塞ぎつつお付き合いいただければと思います。今回はニューラルネットワークによる三次元空間表現手法の紹介と NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis[1] という論文の解説です。PyTorch による再現実装も公開しているのでご覧ください。 続きを読む 三次元空間のニューラルな表現とNeRF

【2019年新卒入社】ブラザー・シスターとの絆が深まる!「ブラシス制度」のご紹介

本ブログを見ていただきありがとうございます。新卒1年目データアナリストの梁木(はりき)です。会社に入ってやっと1つ目のプロジェクトが終わり、社会人の大変さを最近実感しています。
今回は今年度から導入された「ブラシス制度(ブラザーシスター制度)」についてお話したいと思います。
個人でもブログを書いたことがないので、今回が人生初めてのブログです。書き方が合っているのかよくわからないのですが、最後まで読んでいただけるとうれしいです。 続きを読む 【2019年新卒入社】ブラザー・シスターとの絆が深まる!「ブラシス制度」のご紹介

TensorRTを用いたエッジデバイス上でのDNN (Deep Neural Network) 推論高速化

こんにちは。2019年に新卒としてALBERTに入社した、データソリューション本部の水船です。入社してから、画像認識プロトタイピングのツールの開発や、画像認識の研究開発案件に取り組んでいます。また、弊社では先進技術部という部署が新設され、私自身は所属は違うものの、先進技術ワーキンググループの一員として業務の20%をリサーチ業務に充てています。今回は先進技術ワーキンググループの活動として取り組んできた、「TensorRTを用いたエッジデバイス上でのDNN (Deep Neural Network) 推論高速化」について話していきます。

続きを読む

物体検出手法 CornerNet の紹介と実験

こんにちは。先進技術部でアルバイトをしている河田です。
今回は、Law & Dangにより2018年8月に提案された物体検出手法CornerNet[1]について紹介します。

はじめに

CornerNetは
  • 主流の物体検出モデルのほとんどで用いられている Anchor Box を排除
  • Corner Poolingという新しいPooling手法を導入し、Bounding Boxの左上・右下のコーナーを検出
という点で、多くの物体検出手法の中で異彩を放っていました(発表当時)。

本記事では、まずCornerNetの仕組みについて説明したのち、弊社で再現実装を行い独自データセットで訓練した結果を紹介します。 続きを読む 物体検出手法 CornerNet の紹介と実験