【3千円以上送料無料】ITエンジニアのための強化学習理論入門 Pythonで学ぶアルゴリズムの動作原理/中井悦司
楽天市場でこの商品を見る →
楽天市場の商品ページで価格・在庫・レビューをご確認ください。
![]()
【3千円以上送料無料】ITエンジニアのための強化学習理論入門 Pythonで学ぶアルゴリズムの動作原理/中井悦司
ジャンル: AI・機械学習書籍
ショップ: bookfan 1号店 楽天市場店
商品コード: booxstore:12672843
著者中井悦司(著)出版社技術評論社発売日2020年07月ISBN9784297115159ページ数283Pキーワードあいていえんじにあのためのきようかがくしゆう アイテイエンジニアノタメノキヨウカガクシユウ なかい えつじ ナカイ エツジ9784297115159内容紹介前作の『ITエンジニアのための機械学習理論入門』から、5年経過しましたが、AI(人工知能)や機械学習に対しての期待と関心はまったく衰えません。むしろ機械学習の利用はIT業界で当然のものとなり、さらなる活用がさまざまな場所で行われています。前作では一般的な機械学習について解説しましたが、試行錯誤しながら1つの解をもとめていく「強化学習理論」についてくわしく・やさしく解説します。理論を表現するいろいろな数式とそれらをプログラミングするためのPythonコードを並列しながらその理論の神髄にせまり、強化学習の基礎となるさまざまなアルゴリズムを体系的に学びます。※本データはこの商品が発売された時点の情報です。目次1 強化学習のゴールと課題(強化学習の考え方/実行環境のセットアップ/バンディットアルゴリズム(基本編)/バンディットアルゴリズム(応用編))/2 環境モデルを用いた強化学習の枠組み(マルコフ決定過程による環境のモデル化/エージェントの行動ポリシーと状態価値関数/動的計画法による状態価値関数の決定)/3 行動ポリシーの改善アルゴリズム(ポリシー反復法/価値反復法/より実践的な実装例)/4 サンプリングデータを用いた学習法(モンテカルロ法/TD(Temporal‐Difference)法)/5 ニューラルネットワークによる関数近似(ニューラルネットワークによる状態価値関数の計算/ニューラルネットワークを用いたQ‐Learning)
Amazonでも商品を探してみてください →
上のリンクをクリックしてAmazonのサイトでも商品をご確認ください。価格を比べてみて、お得な方でご購入ください。
商品一覧
新着順に表示
