Recommended
Python による 「スクレイピング & 自然言語処理」入門
scikit-learnを用いた機械学習チュートリアル
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
Python 2/3コード共存戦略 #osakapy
Rubyの会社でPythonistaが3ヶ月生き延びた話
メモリアロケーションからみた拡張ライブラリに大切なこと
Pythonはどうやってlen関数で長さを手にいれているの?
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識 第3版
bottle.pyをつかったチャットアプリ作成チュートリアル
Pythonスタートアップ勉強会201109 python入門
IntelliJ IDEAで快適なPython生活
More Related Content
Python による 「スクレイピング & 自然言語処理」入門
scikit-learnを用いた機械学習チュートリアル
What's hot (20) 🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
Python 2/3コード共存戦略 #osakapy
Rubyの会社でPythonistaが3ヶ月生き延びた話
メモリアロケーションからみた拡張ライブラリに大切なこと
Pythonはどうやってlen関数で長さを手にいれているの?
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識 第3版
bottle.pyをつかったチャットアプリ作成チュートリアル
Pythonスタートアップ勉強会201109 python入門
IntelliJ IDEAで快適なPython生活
Viewers also liked (20)
17ゼロから作るディープラーニング2章パーセプトロン
Google SpreadSheetでtwitter bot作ったよ
Learning Phrase Representations using RNN Encoder-Decoder for Statistical Mac...
Effective Numerical Computation in NumPy and SciPy
第3回機械学習勉強会「色々なNNフレームワークを動かしてみよう」-Keras編-
Similar to 14対話bot発表資料 (20)
ドキュメンテーションを加速するストレスフリーの作図ツール『blockdiag』 jus2011年6月勉強会
関数型言語ElixirのIoTシステム開発への展開
Getting Started with Graph Database with Python
LINE BOOT AWARDS に挑む ~テクノロジーファーストでもいいじゃない
2014 0228 OSC-Spring Tokyo NETMF
Ruby向け帳票ソリューション「ThinReports」の開発で知るOSSの威力
Sourcecode Reading Workshop2010
持続的な運用開発のために社内基盤を整えている話 〜auditのCI組み込みやlintの社内PKG化〜
Goodby Hatena, hello Sphinx
2014年を振り返る 今年の技術トレンドとDockerについて
ライブラリ作成のすゝめ - 事例から見る個人OSS開発の効能
WebRTC Rockstars Asian Tour 2017 (JP)
2015 0227 OSC-Spring Tokyo NETMF
Python × Herokuで作る 雑談slack bot
13-E-7 クラウドサービスとゲーミフィケーション: 「TwilioQuest 3」を用いた開発者オンボーディング
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
Docker meetup tokyo_public_r001
Recently uploaded (11) R-SCoRe: Revisiting Scene Coordinate Regression for Robust Large-Scale Visual...
翔泳社 「C++ ゼロからはじめるプログラミング」対応 C++学習教材(三谷純)
生成AIとモデルベース開発:実はとても相性が良いことを説明します。まあそうだろうなと思われる方はご覧ください。
20250823_IoTLT_vol126_kitazaki_v1___.pdf
Yamaha DT200WR Real Enduro ENGINE CYLINDER TRANSMISSION
Geminiの出力崩壊 本レポートは、Googleの大規模言語モデル「Gemini 2.5」が、特定の画像と短文入力に対して、誤った地名を推定し、最終的に...
Working as an OSS Developer at Ruby Association Activity Report 2025
20250826_Devinで切り拓く沖縄ITの未来_AI駆動開発勉強会 沖縄支部 第2回
ココロ分解帳|感情をやさしく分解し自分と他者を理解するためのモバイルノートアプリ
Cosense - 整えずして完全勝利!Cosenseが他のwikiツールと違う理由
14対話bot発表資料2. 自己紹介
名前:宮本圭一郎
SIer で ERP 開発( C#,VB )
freelance
深層学習サービスの開発( python )
@miyamotok0105
https://www.facebook.com/keiichirou.miyamoto
8. データと論文
Corpora
・ AlJohri/OpenSubtitles
Get a lot of raw movie subtitles (~1.2Gb)
・ Cornell Movie-Dialogs Corpus
~ 40Mb after clearing out the technical data.
Papers
[1] Sequence to Sequence Learning with Neural Networks
[2] A Neural Conversational Model
https://github.com/nicolas-ivanov/seq2seq_chatbot_links
11. 文字をベクトル化する
one-hot ベクトル、 bag of words
... 未知語に対応できない。次元が増えすぎる。
文脈ベクトル、 TF-IDF
... 文章全体に占める割合も重みとして考慮
Distributional 表現、 LSI, LDA
...LSI は特異値分解で次元圧縮。 LSI モデルに確率分布を付与
分散表現 (Word Embeddings) 、 word2vec
... 1層のニューラルネットで通常 200 〜 1000 次元程。
単語の定義によってベクトル化
で
す
ね
、
人
工
知
能
で
す
ですね =0
、
=1
人工知能 =2
です =3
one-hot
12. word2vec でベクトル化
king – man + woman = queen
Continuous Bag-of-Words ( CBoW …) 前後の単語から対象単語を予測
Skip-gram... 単語からその周辺単語を予測
で
す
ね
、
人
工
知
能
で
す
0
1
2
3
ですね =0.1
、 =0.2
人工知能 =10
です =0.5
単語の定義によってベクトル化
13. word2vec
king – man + woman = queen
EmbedID 、、、
one-hot ベクトル入力に効率のよい層。 embed_id 関数のラッパー。
one-hot ベクトルは文字に対しベクトル化すること。
16. LSTM の機能
メモリセル、、、過去の状態を記憶( ct )
入力判断ゲート (input modulation gate) 、、、メモリセルに加算
される値を調整する。直近のあまり関係ない情報が影響してメ
モリセルが持つ重要な情報が消失してしまうのを防ぐ。
忘却判断ゲート (forget gate) 、、、メモリセルの値が次の時刻で
どれくらい保持されるかを調整
出力判断ゲート (output gate) 、、、メモリセルの値が次の層にど
れだけ影響するかを調整
23. Chainer の主なクラス
・ Variable... 変数の値の変化を記録する。
・ Function... ネットワークの管理を行う。
・ Link... ネットワークのパラメータを持つ。
・ Chain...Link をまとめたもの。
・ Optimizer... ネットワークを操作する。
・ Dataset.Iterator... 学習対象を辞書型で指定。 (<1.11.0)
・ Training.Trainer... エポック数などを指定 (<1.11.0)
・ Updater... 最適化手法の指定など。 (<1.11.0)
・ Extension... 途中経過の保存など。 (<1.11.0)
モデル定義
変数の変化を記録
AdaGrad 等