forthshinji (@forthshinji)


参加する勉強会

10/8 (木)

Ab1cf4ebe356e9da8e5a76f199c095bd COTOBA Agent Developers Community
OSSを利用した対話システムの作り方
まだまだお申込み受付中! ご好評につき、新たにYoutube Live同時配信決定! お申込み受付を継続中です。 右上の「このイベントに申込む」から「参加枠の選択」へ進み、「Youtube Live同時配信参加」をお選びください。ご登録の方にはイベント開催前にURLをお知らせします。 本勉強会の趣旨 自然言語処理や深層学習のOSSが沢山公開され興味はあるけどなかなか取っ付きにくい、という方もいると思います。理解を進める一つの方法としては「実際にOSSを使って何か動くものを作ってみる」というのが良いのではないでしょうか。このウェビナーでは、深層学習を中心とした自然言語処理関連のOSSと対話システムのOSSを利用した対話システムの作り方を解説します。自然言語処理としては深層学習を用いた文書分類、固有表現抽出、機械翻訳に関する技術と具体的な使い方、対話システムとしては全体的な動作原理と作り方を学ぶことができます。自然言語処理や対話システムの技術の理解を深め、これらを道具として使いこなし色々と応用していくためのきっかけにしていただけますと幸いです。もちろん参加は無料です! 対象者 IT分野のエンジニアで自然言語処理や対話システムに興味をお持ちの方。これからそれらの技術を応用して何かを作って見たいと思っている方。これまで当該分野の技術に馴染みの無かった方も大歓迎です。 開催要領 実施日時: 2020年10月8日(木)18時~20時 実施形態: Webinar 形式によるオンライン開催 参加費: 無料 参加の皆様へ事前のお願い Zoom参加枠が満員となりましたので、Youtube Live同時配信参加枠を新たに設けました。ご登録の方にはイベント開催前にURLをお知らせします インターネットが良好に繋がる環境にてご視聴ください 視聴端末(PC/iPad/iPhone/Android)にZoomをインストールの上、サインアップ/サインインして下さい Zoom Webinar の開催の為、参加者の映像・音声は、配信には一切流れませんが、Q&Aで「匿名」のチェックを入れずに質問いただいた場合、お名前がQ&Aに表示されます。 Zoomのダウンロードはこちらから:https://zoom.us/support/download 17:50頃から入室が可能です。 質問がある方は、セッション中にZoomの「Q&A」タブからテキストで入力してください。各セッションの最後の質問コーナーにてまとめて回答致します。 Twitter でのイベントに関する投稿も大歓迎です!→ハッシュタグ #対話システム勉強会 事前のお問い合わせは、developers_community@cotobadesign.com までお願いします。 講師のご紹介 吉野 幸一郎: 2009年慶大環境情報卒.2011年京大情報修士修了.2014年同博士修了.学振PD,奈良先端大助教を経て2020年より理研 ロボティクスプロジェクト 知識獲得・対話チーム チームリーダー.京大博士(情報学).音声言語処理および自然言語処理,特に音声対話システムに関する研究に従事.2013年度人工知能学会研究会優秀賞,2018年度言語処理学会論文賞等受賞.IEEE,SIGDIAL, ACL, 情報処理学会,言語処理学会,日本ロボット学会各会員. 松田 繁樹:2003年北陸先端科学技術大学院大学博士後期課程修了. 同年, (株)国際電気通信基礎技術研究所(ATR)音声コミュニケーション研究所研究員. 2009年より情報通信研究機構研究員. 2014年より(株)ATR-Trek 先進技術開発部課長. 2019年2月よりコトバデザイン. 博士(情報). ロバスト音声認識, 多言語音声翻訳, 言語理解に関する研究に従事. 2010年4月文部科学大臣表彰受賞. 電子情報通信学会, 情報処理学会, 日本音響学会, 言語処理学会各会員. 高山 隼矢: 2017年豊田工業大学工学部卒業.2019年大阪大学大学院情報科学研究科マルチメディア工学専攻博士前期課程修了.現在,大阪大学大学院情報科学研究科マルチメディア工学専攻博士後期課程に在学中.自然言語処理,特に雑談対話システムに関する研究に従事. 山上 勝義: 京都大学大学院工学部電気系第二学科卒業。パナソニック(株)にて自然言語処理、音声インターフェース、対話システムの研究開発・製品化に従事。2018年4月にFAQチャットサービスをローンチ。産総研出向(2017/02〜2018/12)にて対話システムの研究に従事。2019年2月よりコトバデザインに参画。対話エージェントのソリューション開発を担当。 勉強会アジェンダ 対話システム入門 勉強会の最初の導入として、対話システムの基本知識をレクチャーします。どのような処理モジュールで対話システムが成り立っているか、それぞれの処理モジュールでどんな処理を行っているかを概説します。 講師: 理化学研究所 ロボティクスプロジェクト 知識獲得・対話分野研究チーム チームリーダー 吉野 幸一郎様 AllenNLPによる自然言語理解機能の実装 対話システムの自然言語理解(NLU: Natural Language Understanding)の機能として、インテント認識とスロット認識の技術と実装のエッセンスを解説します。インテント認識は文書分類、スロット認識は固有表現抽出の技術になりますので、応用範囲が広い技術を学ぶことができます。実装には有名なOSSであるAllenNLPを用います。 講師: 株式会社コトバデザイン プリンシパルリサーチャー 松田 繁樹 OpenNMTによる雑談対話機能の実装 seq2seq モデルによる雑談対話の技術と実装のエッセンスを解説します。OpenNMTという有名な機械翻訳関連のOSSによる実装を説明しますので、機械翻訳の仕組みを学ぶことにもなります。 講師: 大阪大学大学院情報科学研究科 マルチメディア工学専攻 高山 隼矢様 COTOBA Agent OSSによる対話システムの実装 AIML言語によるルールベースの対話シナリオ実装を中心に、2, 3 の実装を利用して対話システムの構築の過程を解説します。COTOBA Agent OSSだけでも対話システムを作ることができますので、実際に動く対話システムの作り方のエッセンスを学ぶことができます。 講師: 株式会社コトバデザイン プリンシパル・ソリューションアーキテクト 山上 勝義 株式会社コトバデザインについて 私たちは、世界中のクリエイターがAIを対話インタフェースとして自由にコンテンツ開発できる世界を作ること、対話インタフェースを通じてより便利で彩りのある生活を実現することを目指して、対話コンテンツ開発プラットフォームの研究・開発を行なっています。


過去の勉強会

6/19 (金)

概要 2020年5月開催の国際学術会議 ICASSP2020 の音声&音響に関する論文読み会です。 今年は 平日にバーチャル開催 となります. URLはこちら https://2020.ieeeicassp.org/ 機械学習に関する論文を普段読んでいる研究者、学生、エンジニアの方を想定しておりますが、誰でもご参加いただけます。 終了後にバーチャル懇親会をやるかもしれません. 発表者について 先着で募集いたします。 紹介したい論文に沿って、ジャンル(音声生成・認識・信号処理・音楽)を選択頂きますようお願いします。 ジャンルの配分は調整する場合がございます。 バーチャル会場案内 ZOOMを使用します。各自インストールをお願いします。 URLはこちら. 発表形式 質疑込み20分(目安:講演17分、質疑3分) 音声、音楽などを再生させる場合は画面共有時に音声も共有するを選択ください。 セッション後にディスカッション・質疑応答の時間を取っておりますので、そちらでも議論頂けます。 講演者は、お手数ですが各セッション終了後までは待機頂く様、よろしくお願いします。 質問事項はGoogle documentに記載して頂き、答えて行く形式とします。 発表資料に関しては、発表前にSlideShareやSpeaker Deck等にアップロードして頂き、ハッシュタグ #icassp2020jp でつぶやいていただくか、主催者までご連絡をお願い致します。 キャンセル 参加は抽選(先着順)になりますが、より多くの方へご参加いただきたいと考えています. 大まかな参加人数を把握するために,当日都合が悪くなって参加できないことが判明した方は、お手数ですが速やかにキャンセル処理をお願いします. その他 本勉強会は、技術交流が目的です。知識の共有や参加者同士の交流を目的としない方の参加はお断りします。 参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。 スケジュール 時刻 講演者 タイトル 13:00-13:10 開会挨拶 橘 健太郎 (DeNA) - 13:10-13:30 音声生成1 斎藤 佑樹(東大) BOFFIN TTS: FEW-SHOT SPEAKER ADAPTATION BY BAYESIAN OPTIMIZATION SlideShare 13:30-13:50 音声生成2 藤本 敬介(ABEJA) F0-Consistent Many-to-Many Non-Parallel Voice Conversion via Conditional Autoencoder SlideShare 13:50-14:10 音声生成3 橘 健太郎(DeNA) MELLOTRON: MULTISPEAKER EXPRESSIVE VOICE SYNTHESIS BY CONDITIONING ON RHYTHM, PITCH AND GLOBAL STYLE TOKENS SlideShare 14:10-14:15 ディスカッション・質疑応答 - - 14:15-14:25 Break - - 14:25-14:45 信号処理1 寺下 直行 An Improved Selective Active Noise Control Algorithm Based on Empirical Wavelet Transform SlideShare or SpeakerDeck 14:45-15:05 信号処理2 玉森 聡(愛知工業大) State-Space Gaussian Process for Drift Estimation in Stochastic Differential Equations SpeakerDeck 15:05-15:25 信号処理3 土肥 宏太(日立製作所) An Ontology-Aware Framework for Audio Event Classification SlideShare or SpeakerDeck 15:25-15:30 ディスカッション・質疑応答 - - 15:30-15:40 Break - - 15:40-16:00 音声認識1 鈴木 雅之(IBM research) Alignment-length synchronous decoding for RNN transducer SpeakerDeck 16:00-16:20 音声認識2 柏木 陽佑(Sony) UNSUPERVISED SPEAKER ADAPTATION USING ATTENTION-BASED SPEAKER MEMORY FOR END-TO-END ASR SlideShare 16:20-16:40 音声認識3 上乃 聖 (京大) CIF: CONTINUOUS INTEGRATE-AND-FIRE FOR END-TO-END SPEECH RECOGNITION SlideShare 16:40-16:45 ディスカッション・質疑応答 - - 16:45-16:55 Break - - 16:55-17:15 音楽1 植村 あい子 Transformer VAE: A Hierarchical Model for Structure-Aware and Interpretable Music Representation Learning SlideShare 17:15-17:35 音声生成4 岡本 拓磨(NICT) AlignTTS: Efficient feed-forward text-to-speech system without explicit alignment SpeakerDeck 17:35-17:40 ディスカッション・質疑応答 - - 17:40-17:50 閉会挨拶 - - 18:00-19:30 オンライン懇親会 - -