技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

機械学習による論文・特許文書解析と技術/市場動向の抽出

機械学習による論文・特許文書解析と技術/市場動向の抽出

東京都 開催 会場 開催

開催日

  • 2020年3月2日(月) 10時00分 17時00分

プログラム

第1部. テキストマイニングの基礎と近年の機械学習技術の応用

(2020年3月2日 10:00〜12:00)

 IT技術の進歩の中で、近年ではIoTやビッグデータ、AIなどが注目され、様々な実践が行われている。自然言語処理、その一分野であるテキストマイニングもそのひとつである。現在主流のテキストマイニングでは形態素解析とその結果に基づく計量・共起分析が中心的な手法である。しかし、機械学習技術の進歩の中でSkip-gramなどの手法が開発され、それらを活用した分散表現テキストマイニングが実用化され始めている。これの特徴は、これまでは難しかった意味に基づく分析を可能にする点にある。
 この講座では、講師の研究事例を用いながら、テキストマイニングにおける計量的手法とその弱点を概観し、これらを克服する可能性のある分散表現テキストマイニングについて見ていく。機械学習技術を用いたテキストマイニングは、未完成の物であり、現在も新しい技術が次々に発表されている。この講座は、参加者が新しい技術を取り入れる際の足掛かりとなるものを目指している。

  1. テキストマイニングについて
    1. テキストマイニングとは
    2. テキスト分析の手順
  2. 計量テキスト分析の例
    1. 計量分析
    2. 共起分析
  3. 計量テキスト分析の弱点
  4. 機械学習技術を用いた分散表現テキストマイニング
    1. コサイン類似度を用いた分析
  5. 機械学習技術を複合的に用いた分析例
    1. 相関分析との併用
  6. 分散表現テキストマイニングの背景技術
    1. skip-gramについて
  7. 分散表現テキストマイニングの限界
    • 質疑応答

第2部. 機械学習技術を用いた技術文書からの動向情報の抽出およびその可視化

(2020年3月2日 12:45〜14:45)

 産業と関連性が高い企業や研究者にとって特許や論文などの技術文書の分析をすることは、特定分野の動向を知るうえで重要である。また、このような動向情報は、その分野への新規参入やその技術への投資の選定などを判断するうえで有用な材料となる。しかしながら、限られた時間の中で特定分野に関する情報を網羅的に収集し、分析することは容易ではない。こうした状況を鑑み、機械学習を用いて技術文書から特定分野の技術動向を効率的に把握するための研究や取り組みが数多く行われている。
 本発表では、技術文書を対象とした技術動向の分析・可視化を行うためのシステムやその言語処理技術、研究プロジェクトなどについて述べる。

  1. 技術動向分析に対する概観
    • 技術動向分析の目的
    • 技術動向分析の流れ
    • 技術動向分析に関する研究プロジェクト
  2. 技術文書からの動向情報の抽出に関する機械学習技術
    • 言語処理技術 (構造解析,固有表現抽出など)
    • 機械学習に用いる入力データの作成
  3. 技術動向の可視化
    • 技術動向の可視化に対するモチベーション
    • 可視化ツール・システム
    • 可視化までの流れ
    • 質疑応答

第3部. pythonを使った特許文書の教師なし学習による可視化と教師あり学習による分類・スクリーニング

(2020年3月2日 15:00〜17:00)

 Python (Anaconda/Google Colaboratory) 上の機械学習フレームワーク (Scikit-learn/Tensorflow-Keras) を使用し、自ら特許文書を解析するコツを紹介します。
 まず特許文書を下処理して文法に従って切り出し、テキストマイニングの手法でキーワードを抽出して可視化する方法を紹介します。次に、機械学習で取り扱い可能なように特許文書を数値化する「文書ベクトル化」方法を解説します。さらに、得られた文書ベクトルを用いて教師なし学習による可視化と文書分類する方法、教師あり学習によるニューラルネットワークの手法で文書分類する方法を紹介します。

  1. 形態素解析とキーワード可視化
    1. 形態素解析器の導入と使用
    2. TermExtractを用いたキーワード抽出と可視化
  2. 文書ベクトル化
    1. 単語ID、BoWおよびTF-IDF
    2. 分散表現 (word2vec、Doc2Vec)
  3. 教師なし学習による可視化
    1. 次元圧縮
    2. クラスタリング (k-means法)
    3. 自己組織化マップ (SOM)
  4. ニューラルネットワークを用いた教師あり学習
    1. MNISTチュートリアルの解説
    2. 1次元CNNによる2値分類
    3. 確率出力
    • 質疑応答

講師

  • 竹岡 志朗
    吉備国際大学 社会科学部 経営社会学科
    講師
  • 福田 悟志
    九州大学 システム情報科学研究院
    特任助教
  • 西尾 潤
    株式会社ユポ・コーポレーション 市場開発部

会場

株式会社 技術情報協会
東京都 品川区 西五反田2-29-5 日幸五反田ビル8F
株式会社 技術情報協会の地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 55,000円 (税別) / 60,500円 (税込)
複数名
: 50,000円 (税別) / 55,000円 (税込)

複数名同時受講割引について

  • 2名様以上でお申込みの場合、
    1名あたり 55,000円(税別) / 59,400円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 60,000円(税別) / 64,800円(税込)
    • 2名様でお申し込みの場合 : 2名で 110,000円(税別) / 118,800円(税込)
    • 3名様でお申し込みの場合 : 3名で 165,000円(税別) / 178,200円(税込)
  • 同一法人内による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 他の割引は併用できません。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2024/6/19 医療機器とヘルスケア機器 (非医療機器) に向けた薬機法と製品/パッケージデザイン・商品プロモーション開発 東京都 会場・オンライン
2024/6/19 外観検査自動化に向けた画像処理・AI技術活用の課題と導入のポイント オンライン
2024/6/20 後発でも勝てる特許出願と権利化戦略 オンライン
2024/6/20 適正な知財コストの考え方と権利化、維持・放棄の決め方 オンライン
2024/6/20 医薬品の知財制度と特許戦略 入門講座 オンライン
2024/6/20 ISO 13485:2016対応に必須の医療機器プロセスバリデーション (進め方、統計的手法とそのサンプルサイズ) オンライン
2024/6/21 市場分析・競合他社ベンチマーキング分析と情報収集の進め方 オンライン
2024/6/24 外観検査の自動化の進め方と画像データ取得およびAIによる検査のポイント オンライン
2024/6/24 小規模データに対する機械学習の効果的適用法 オンライン
2024/6/24 オンコロジー領域における医薬品売上予測手法とデータ収集及び注意点 オンライン
2024/6/25 医療機器開発のための事業化戦略とプロジェクトマネージメント オンライン
2024/6/26 新規事業創出のための発想法と技術ロードマップの作成、技術・事業・知財戦略の実践方法 オンライン
2024/6/26 少ないデータに対する機械学習の適用と学習結果の評価技術 オンライン
2024/6/26 分割出願、及び、除くクレームを活用した強い特許権の取得・行使のための特許戦略 オンライン
2024/6/27 新規モダリティ医薬の市場規模/薬価/売上予測と事業性評価 オンライン
2024/6/28 技術者・研究者のための特許の効率的な読み方と強い特許取得への生かし方 オンライン
2024/6/28 医療機器とヘルスケア機器 (非医療機器) に向けた薬機法と製品/パッケージデザイン・商品プロモーション開発 オンライン
2024/7/1 ISO 13485:2016対応に必須の医療機器プロセスバリデーション (進め方、統計的手法とそのサンプルサイズ) オンライン
2024/7/3 医薬品の知財制度と特許戦略 入門講座 オンライン
2024/7/3 オンコロジー領域における医薬品売上予測手法とデータ収集及び注意点 オンライン

関連する出版物

発行年月
2012/6/15 紙おむつ 技術開発実態分析調査報告書 (CD-ROM版)
2012/6/5 空気清浄機 技術開発実態分析調査報告書 (CD-ROM版)
2012/6/5 空気清浄機 技術開発実態分析調査報告書
2012/6/1 防音・吸音・遮音材 技術開発実態分析調査報告書 (CD-ROM版)
2012/6/1 防音・吸音・遮音材 技術開発実態分析調査報告書
2012/6/1 冷蔵庫 技術開発実態分析調査報告書 (CD-ROM版)
2012/6/1 冷蔵庫 技術開発実態分析調査報告書
2012/5/25 化粧品13社 技術開発実態分析調査報告書
2012/5/25 化粧品13社 技術開発実態分析調査報告書 (CD-ROM版)
2012/5/20 エレクトロニクス分野へのダイヤモンド応用技術 技術開発実態分析調査報告書 (CD-ROM版)
2012/5/20 エレクトロニクス分野へのダイヤモンド応用技術 技術開発実態分析調査報告書
2012/5/1 リチウムイオン電池 技術開発実態分析調査報告書
2012/5/1 界面活性剤 技術開発実態分析調査報告書 (CD-ROM版)
2012/5/1 界面活性剤 技術開発実態分析調査報告書
2012/5/1 リチウムイオン電池 技術開発実態分析調査報告書 (CD-ROM版)
2012/4/20 デジカメ主要8社の静止画信号処理技術 技術開発実態分析調査報告書 (CD-ROM版)
2012/4/20 デジカメ主要8社の静止画信号処理技術 技術開発実態分析調査報告書
2012/4/15 Intel 【米国特許版】 技術開発実態分析調査報告書
2012/4/10 電動アシスト自転車 技術開発実態分析調査報告書
2012/4/5 非鉄金属10社 技術開発実態分析調査報告書