Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Text Mining of Juice Patents

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for zincjp zincjp
April 06, 2019
270

Text Mining of Juice Patents

Avatar for zincjp

zincjp

April 06, 2019
Tweet

Transcript

  1.  ジュース(果汁、野菜汁)の特許467件を企業毎に解析・可 視化。  野菜ジュース系:伊藤園 カゴメ デルモンテ  それ以外:アサヒ キリン

    コカ・コーラ サッポロ サントリー ヤクル ト  文書-単語頻度行列を作成し解析。 (Bag of Words、tf*idf) 今回の概要 2019/4/6 20190406Fukuoka.R 2
  2.  解析・可視化手法  ワードクラウド  主成分分析  対応分析  多次元尺度法

     k-means  アソシエーションルール解析  使ったパッケージ(主なもの)  RMeCab  dplyr  wordcloud  stringr  Magrittr 今回の概要 2019/4/6 20190406Fukuoka.R 3
  3.  果汁、野菜汁を含むジュースの公開特許465公報の要約部分。 出願人は以下に限定。  野菜ジュース系  伊藤園、カゴメ、デルモンテ  それ以外 

    アサヒ、キリン、 コカ・コーラ、 サッポロ、サントリー、ヤクルト  検索詳細  対象公報:公開系公報  公開 1993年~2018年02月01日  公表 1993年~2018年02月01日  再公表 1993年~2018年02月01日  検索式  A23L2/02/ANY IPC AND (アサヒ+伊藤園+カゴメ+キリン+ コカ・コーラ+ +サッポロ+サントリー+デルモンテ+ポッカ+ヤクルト)/ 出願人・権利者 AND 19930101:/公報発行日 →465件  特許分類 ・A23L A21DまたはA23BからA23Jまでに包含されない食品,食料品,または非アルコール性飲料;その調製または処理,例.加熱調 理,栄養改善,物理的処理[4,8] ・2/00(2006.01)非アルコール性飲料;その乾燥組成物または濃縮物;それらの調製(スープ濃縮液A23L23/10;アルコー ルの除去による非アルコール飲料の製造C12H3/00)[2] ・2/02(2006.01)・果実または野菜ジュースを含有するもの[2] 5 解析対象 2019/4/6 20190406Fukuoka.R
  4.  共願-2社以上で共同して出願された場合。  それぞれの会社に1件として割り振った  特開2013-188191:アサヒビール(株)、カゴメ(株)  特開2007-089433:伊藤園・日本デルモンテ  権利者変更-権利は譲渡することが出来る。

     現在ジュースメーカー以外の出願人は元出願人として扱う  特開2006-166880:現在は三菱重工だが、元はポッカと東洋製作所共願 →サッポロ・ポッカとして扱う  合計467公報(2公報は上の共願による重複)を解析 7 前処理1 共願、権利者変更 2019/4/6 20190406Fukuoka.R
  5.  出願人表記、企業統合が有ったため以下の通り名寄せを行った。  アサヒ: アサヒビール(株)、アサヒ飲料(株)、アサヒグループホールディ ングス(株)、アサヒグループ食品→66件  伊藤園:(株) 伊藤園→83件 

    カゴメ:カゴメ(株) →84件  キリン:キリン(株)、キリン・トロピカーナ(株)、キリンホールディングス(株)、 キリンフードテック、キリン協和フーズ(株)→39件  コカ・コーラ:ザコカ・コーラカンパニー、日本コカ・コーラ(株)→39件  サッポロ:ポッカサッポロフード&ビバレッジ(株)、サッポロビール(株)→36 件  サントリー:サントリーホールディング(株)、サントリー食品インターナショナ ル(株)、サントリー酒類(株)→63件  デルモンテ:日本デルモンテ(株)→33件  ヤクルト: (株)ヤクルト本社、ヤクルトヘルスフーズ(株)→24件 8 前処理2 名寄せ 2019/4/6 20190406Fukuoka.R
  6.  作成したtxtファイルをRMeCabで形態素解析  解析対象品詞は以下の通り  POS1=名詞,形容詞,動詞  POS2=一般,固有名詞,自立  以下単語は解析から除外した(stopワードの設定)

     1つ|一つ|ある|する|できる|ない|なる|よい|よる|易い|該|含む| 好ましい|手段|課題|目的|与える|工程|有す|優れる|得る|特 徴|用いる|感じる|方法|範囲|上記|量|良い|選ぶ|係る|条件下| 値|所定|示す|行う|mg|kg|ppb|L 10 解析詳細 解析品詞限定、stopword設定 2019/4/6 20190406Fukuoka.R
  7. 20190406Fukuoka.R ワードクラウド 非野菜ジュース系 13 アサヒ キリン コカコーラ サッポロ サントリー ヤクルト

    「アレルギー」 が特徴的。 「甘味」「カロリー」 「糖」が特徴的。 「レモン」「クエン (酸)」が特徴的。 ポッカを買収。。 「トマト」がないが、野 菜ジュースを販売 「エキス」が特 徴的。 「紅茶」が特徴 的。 2019/4/6
  8.  中心数=3でクラスタリング 1. [1] 伊藤園 カゴメ 2. [1] コカコーラ 3.

    [1] アサヒ キリン サッポロ サントリー デルモンテ ヤクルト  中心数=2でクラスタリング 1. [1] コカコーラ 2. [1] アサヒ 伊藤園 カゴメ キリン サッポロ サントリー デル モンテ ヤクルト  中心数=5でクラスタリング 1. [1] アサヒ キリン サントリー 2. [1] サッポロ デルモンテ ヤクルト 3. [1] コカコーラ 4. [1] カゴメ 5. [1] 伊藤園 17 K-meansでクラスタリング 2019/4/6 20190406Fukuoka.R