Upgrade to Pro — share decks privately, control downloads, hide ads and more …

『ギャップを測る』特許と論文データを用いたイノベーションプロセスにおけるジェンダーギャップ分析

yasushihara
December 10, 2019

 『ギャップを測る』特許と論文データを用いたイノベーションプロセスにおけるジェンダーギャップ分析

『ギャップを測る』特許と論文データを用いたイノベーションプロセスにおけるジェンダーギャップ分析

2019/12/10 16:30-17:45
於; 広島大学 国際型ダイバーシティ研究環境実現プログラムセミナー
一橋大学大学院経済学研究科
原泰史
[email protected]
http://orcid.org/0000-0001-9500-1150

yasushihara

December 10, 2019
Tweet

More Decks by yasushihara

Other Decks in Education

Transcript

  1. SELF INTRODUCTION: YASUSHI HARA 2002-2009 IT COMPANY EMPLOYEE (Clara Online,

    Inc.) 2009-2012 JSPS DC1 2012-2014 Research Associate, Institute of Innovation Research, Hitotsubashi University, Tokyo, JAPAN. 2015-2018 Specialist, SciREX Centre, National Graduate for Policy Studies 2018 Michelin Fellow, CEAFJP/EHESS, Paris, France. 2019- Adjunct Associate Professor, Faculty of Economics, Hitotsubashi University, Tokyo, JAPAN.
  2. MOTIVATION OF RESEARCH  工藤さん  ローソンに新卒で入社  健康増進プロジェクト、新製品開発などを担当 

    2015-2017 まで、子会社の副社長を担当  2019/12/10 (本講演日) に広島修道大学で講演  今はフリーランスとしてマーケターや経営戦略立案を行う  おおよそ、奥さんや妻や連れやワイフという言葉には当てはまらない  かといって、パートナーというのも横文字で気恥ずかしい。  結果公の場での呼称は「工藤さん」に落ち着く。  女性であることにメリットもデメリットもないはずなのに、なぜか 「女性」であることで便益も損益もあることを工藤さんから知る
  3. 科学者の多様な取り組みをキャプチャする  ある程度は正規化されたデータ  特許 (共著, 前方引用, 後方引用)  論文

    (共著, 前方引用, 後方引用, Acknowledgement)  ファンド (取得額, 取得の種類, ファンディンエージェンシーの種類)  企業への参画 (Board Member)  ジェンダーギャップ  不定形なデータ  ソーシャルメディア上での活動  プレスリリース  メディア  審議会への参画  Social Impact
  4. DATA; FROM MICRO, MESO TO MACRO Macro National/Global level Meso

    Industry/firm level (University/Company) Micro Individual Level (Scientist/Inventor) PATENT - Inventor - Assignee - Patent Number - IPC - Patent Family - Non Patent Literature PAPER - Author - Organization - Category - Acknowledgement DESIGN - No. - Designer Name FUND - No. - Tied Patent/Paper N. Science Linkage Economic Census Innovation Survey(NISTEP) INPUT-OUTPUT TABLE (I/O) Macro Economic Model Funding Database Press Release Survey of Research and Development (Statistics JAPAN) SNA (System of National Accounts; GDP)
  5. Star Scientist Data Platform (a.)Scientific Paper DB SCOPUS Web of

    Science J-global Data ・# of paper ・# of cited ・Research Categories Convincing three Paper databases to capture scientific activities in global/local journal. Star Scientist Cohort Data Method: Converting XML -> SQL, then Creating Panel Data in the unit of Researcher/Organization (b.)Patent DB PATSTAT (EPO) Patents View(USPTO) J-global (JPO) IIP PatentDB (JPO) Data ・ # of patent ・ # of patent cited ・FI code/IPC code Using three major Patent Office (USPTO, EPO and JPO) to manage Patent Families. Matching DB bet. Patent = Paper Using disambiguation algorism to normalize researcher and his/her organization information. Using Mecab to coordinate Japanese characters (c.)Academic Funding DB SPIAS (SciREX/NISTEP/JST) KAKEN-DB (NII/JST) RePORT (NIH) Nanobank COMMETS (Z&D) Data ・Amount of Fund Budget ・Direct/Indirect Ratio ・Type of Funding Agency Covering Japan (SPIAS, KAKEN- DB) and US (RePORT, Nanobank) Fund data simultaneously (d.) Venture Company Info DB Entrepedia Crunchbase Data ・Carrier/Position of Scientist in Venture Capital Covers Japan (Entrepedia) and US (Crunchbase) database simultaneously, evaluate the economic impact of star scientist Method. Retrieving the data via API, CSV or JSON format. Creating Panel Data in the unit of Researcher/Organization Method. Retrieve the data from Web interface. Method: Converting XML -> SQL, then Making Panel Data in the unit of Researcher/Organization Press Release News Paper
  6. DOES GENDER AFFECT SCIENTIFIC PRODUCTIVITY?  AUTHORS;  フランスの女性研究者と男性研究者のパフォーマンスを比べるのが目的の研究. 

    French CNRS と大学の物理学者が対象. 同名のタイトルで公表済み. (Cole and Zuckerman 1984) が明 らかにした, 女性の研究者が男性の研究者に比べてパブリケーションの生産性が低い Productivity Puzzle (gender gap or gender bias) の問題に着目.  “The intuitive belief that marriage and motherhood cannot be mesh with a demanding scientific career has been termed an empirically untenable stereotype” (Toren Nina 1991) を踏まえ, 研究のモチベーション は個々人の研究の生産性を測定すること.  データの対象は2004年から2005年に活動したフランスの物理学者. 1975年から2005年までのパブ リケーションデータを Web of Knowledge から抽出
  7. DOES GENDER AFFECT SCIENTIFIC PRODUCTIVITY? (CONT.)  インパクトファクターで調整を行い研究者の生産性を測定したところ, CNRS の場合,

    男性の平均パ ブリケーション数は59.96, 女性の場合は38.58.  大学の場合は女性が13.14, 男性の場合が 27.15.  低い生産性の研究者を除外した場合も, CNRS の場合は 48.52 (女性) / 65.99 (男性).  大学の場合は 30.2 (女性) / 37.13 (男性).  パブリケーションをあまり行っていない研究者の割合は, CNRS の場合女性が20%, 男性が9%.
  8. DOES GENDER AFFECT SCIENTIFIC PRODUCTIVITY? (CONT.)  研究者の生産性を測定するために, log(Prod*) =

    f (Gender, A, IC, Prob(RANK), λ) という関数を設定.  説明変数としては, 共著者の生産性, 共著者の数, CNRS とのコラボレーションを行ったかどうか, キャリアの年数, ディシプリン横断的なコラボレーションを行ったか否か, 国際的な共著者がいた か否かなどを指定し解析  生産性はCNRSの場合40歳前後で女性が男性を逆転することが判明.  大学の場合は男女間で違いは起きていないことを明らかに
  9. DOES GENDER AFFECT SCIENTIFIC PRODUCTIVITY? A CRITICAL REVIEW OF THE

    EMPIRICAL EVIDENCE AND A PANEL DATA ECONOMETRIC ANALYSIS FOR FRENCH PHYSICISTS  AUTHORS; Jacques Mairesse and Michele Pezzoni  URL; https://www.cairn-int.info/abstract-E_RECO_661_0065--does-gender-affect.htm  Abstracts;  PhD Student の論文公刊における, Gender Gap の効果を測定することが目的.  アドバイザーの性別の影響, チームの構成や男女比, Graduate Student との関係性などに着目.しラボの構成 が与える影響に着目. 学生の性別, アドバイザーお性別, チームの男女比などを測定するために, STARMETRICS および UMETRICS データベースを活用.  ジェンダーの特定には US Social Security レコードを活用.  パブリケーションの情報は Web of Knowledge を利用.
  10. DOES GENDER AFFECT SCIENTIFIC PRODUCTIVITY? A CRITICAL REVIEW OF THE

    EMPIRICAL EVIDENCE AND A PANEL DATA ECONOMETRIC ANALYSIS FOR FRENCH PHYSICISTS (CONT.)  Abstracts (Cont.);  933 人の PhD データを収集し. サンプルサイズ5,151から, パネルデータを作成. アドバイザーの数は 204人. 女性PhD のパブリケーションはドクター取得後男性の平均パブリケーション数と等しくなる ことを明らかに.  PhD Student が女性のアドバイザーについたほうが, パブリケーションの割合は高くなる.  女性のPhD Student が初年度にパブリケーションを行う割合は, 男性がアドバイザーの場合 (38.8%) よ り女性がアドバイザーの場合のほうが高くなる (44.2%).  ただし, 総体的な論文の生産数はアドバイザーの性別に寄らない.回帰分析の結果, 女性のアドバイ ザーがいることは論文の生産性を向上させることや, 初年度にパブリケーションがあることも, 総合 的な生産性を向上させることを明らかに.
  11. DOES GENDER AFFECT SCIENTIFIC PRODUCTIVITY? A CRITICAL REVIEW OF THE

    EMPIRICAL EVIDENCE AND A PANEL DATA ECONOMETRIC ANALYSIS FOR FRENCH PHYSICISTS (CONT.)
  12. DOES GENDER AFFECT SCIENTIFIC PRODUCTIVITY? A CRITICAL REVIEW OF THE

    EMPIRICAL EVIDENCE AND A PANEL DATA ECONOMETRIC ANALYSIS FOR FRENCH PHYSICISTS (CONT. 2)  Abstracts (Cont.);  研究チームの男女構成の影響を測定.  チームのサイズは平均8.17.  男性の学生が女性のアドバイザーについた場合はプラスの効果, 女性の学生が男性のアドバイザーについ た場合はマイナスの効果が.
  13. PATENTS VIEW GENDER DISAMBIGUATION  名前の特定方法(データセット)  Global Name Recognition

    (IBM-GNR), a name search technology produced by IBM  the association of names and surnames to one or (more often) several countries of likely origin. Second, the association of names to male and female gender and their associated probabilities.  These associations originate from a database produced by the US immigration authorities in the first half of the 1990s, which registered all names and surnames, along with nationality and gender, of all foreign citizens entering the US. It contains a total of roughly 750,000 full names.  WIPO worldwide gender-name dictionary (WGND), produced by the World Intellectual Property Organization (WIPO). It includes a list of 6.2 million names from 182 different countries. For each name contained in the dataset, it attaches a given gender to each name by country where that name appears in the original source data
  14. PATENTS VIEW GENDER DISAMBIGUATION  特定アルゴリズム(baseline) 1. For each inventor

    name, IBM-GNR returns the share of instances it identifies as male in the data source and the share it identifies as female. It also returns an additional metric (“frequency”), which indicates the frequency percentile that each name belongs within the complete dataset. 2. For each inventor first name, we attribute female gender to a given inventor if it is identified as female in 97% or more cases and we attribute male gender to a given inventor if it is identified as male in 98% or more cases. 3. When the inventor name is majority female (but not in the 97% of the cases) and the second (or middle) name is 97% or more female, we also attribute female gender. Similarly, when the inventor 5 name is majority male (but not in the 98% of the cases) and the second name is 98% or more male, we attribute male gender. 4. For the remaining 943,725 inventor names, we rely on WIPO’s WGND. As mentioned previously, WGND is a dictionary of 6.2 million names associated with 182 different countries. For each name+country pair, we can match the inventor name to the WGND to determine whether the name has predominantly female or male attribution within that country. To do this, we first need to assign a country of origin to each inventor. (snip) it is able to attribute gender to 3,206,605 inventors, 92.08% of all USPTO inventors
  15. PATENTS VIEW GENDER DISAMBIGUATION  特定アルゴリズム (« baseline-augmented ») 

    12) For inventors whose surname is primarily associated with China, Singapore, Taiwan, Macao, or Hong Kong (even when they do not reside in those countries), we attribute female gender if it is identified as female in 60% or more cases, and we attribute male gender if it is identified as male in 60% or more cases (threshold decided upon visual inspection of the distribution of GNR’s shares).  13) For inventors whose surname is primarily associated to the Republic of Korea (even when they do not reside in that country), we attribute female gender if it is identified as female in 80% or more cases, and we attribute male gender if it is identified as male in 80% or more cases (threshold decided upon visual inspection of the distribution of GNR’s shares)  14) For inventors whose surname is primarily associated to India (even when they do not reside in that country), we attribute female gender if it is identified as female in 90% or more cases, and we attribute male gender if it is identified as male in 90% or more of the cases (threshold decided upon visual inspection of the distribution of GNR’s shares).  After conducting these remaining steps, we attributed gender to 38,188 additional inventors. In total, our (baseline- augmented) method attributes gender to 3,244,813 inventors, 93.18% of all USPTO inventors (6.82% of non-attributed cases)
  16. データソース(論文)  論文データベース  Web of Science Core XML Collection

    (1981-2015)  NISTEP WoSCC-NISTEP大学・公的機関名辞書対応テーブル(ver.2017.1.1)  https://www.nistep.go.jp/research/scisip/randd-on-university  データカバレッジ  1998-2015年  Web of Science XML Collection は1981年から2015年までカバー
  17. ジェンダー分類データ  米国の場合  子どもの名前がOpen Data として公開されている  年ごとに、名前、命名数、性別、人種の情報が公開さ れている

     “Popular Baby Names by Sex and Ethnic Group Data were collected through civil birth registration. Each record represents the ranking of a baby name in the order of frequency. Data can be used to represent the popularity of a name. Caution should be used when assessing the rank of a baby name if the frequency count is close to 10; the ranking may vary year to year.”  https://catalog.data.gov/dataset/most-popular-baby- names-by-sex-and-mothers-ethnic-group-new-york-city- 8c742
  18. 「名寄せ」問題  ケーススタディでみたように、人の名前は間違いやすい  記法も雑誌やデータベースによって異なる  特許と論文データを接合するだけでも大変 (Ikeuchi et al.

    2017)  名前を接合するための取り組みはこれまでに数多く存在 (Lai 2013) (Hussain and Asgher 2017)  まずは名寄せしなくてもいい場合をご紹介します
  19. 日本出身のノーベル賞受賞者の特性 コア研究を行った 年齢 コア研究から 受 賞 までの年数 平均受賞年齢 受賞タイプ 日

    本 人 受賞者 日 本 人 受 賞者以外 日 本 人 受 賞者 日 本 人 受 賞 者 以外 日 本 人 受 賞者 日 本 人 受 賞 者 以外 化学賞 39.29 37.50 27.57 22.51 66.86 60.02 生理学医学賞 38.67 36.55 20.67 22.35 59.33 58.90 物理学賞 39.27 36.92 24.27 20.71 63.55 57.63 総計 39.19 36.95 24.86 21.84 64.05 58.79  日本出身の受賞者(N=21)の場合、コア研究 にとりかかる年齢が、化学賞では 39.3 歳 (対照群[海外出身の受賞者 N=425] 37.5歳)、 生理学医学賞の場合38.7歳 (対照群 36.6 歳)、 物理学賞の場合39.3 歳 (対照群 36.9歳)と、 おおよそ2-3年ほど遅いことが確認できる。  また、受賞に至るまでの年数も、化学賞が 27.6年 (対照群 22.5年)、生理学医学賞が 20.6年 (対照群 22.4年)、物理学賞が 24.3年 (対照群 20.7年)と、生理学医学賞を除きよ り長い年数を要していることがわかる。こ れにより、ノーベル賞の平均受賞年齢も 64.1歳と比較的高い。 (原・壁谷・小泉 2017)
  20. 「名寄せ」するためのツール  ID-based Matching 1. Orcid 2. WebofScience/Researcher ID aka

    Publons 3. WebofScience/DaisID 4. Scopus/Author ID 5. MicrosoftAcademics/Author ID 6. Lens.org/Author Identifiers  Semantic Matching  (Lai et al. 2013)  (McCallum and Monath 2015) - https://github.com/iesl/inventor-disambiguation, https://github.com/CSSIP- AIR/PatentsProcessor
  21. 研究者単位で名寄せするいくつかの方法 (1): ORCID  ORCID iD is an https URI

    with a 16-digit number that is compatible with the ISO Standard (ISO 27729), also known as the International Standard Name Identifier (ISNI), e.g. https://orcid.org/0000-0001-2345-6789  Initially ORCID iDs will be randomly assigned by the ORCID Registry from a block of numbers that will not conflict with ISNI-formatted numbers assigned in other ways. ORCID iDs always require all 16 digits of the identifier; they can not be shortened to remove leading zeros if they exist.  No information about a person is encoded in the ORCID iD. The identifiers were designed to be usable in situations where personally-identifiable information should/can not be shared. Also, since the ORCID iD is designed to be a career-long identifier, no information that can change over a person's career is embedded in the iD, e.g., country, institution, field of study. https://support.orcid.org/hc/en-us/articles/360006897674
  22. ORCID のWEB OF SCIENCE CUSTOM DATA におけるカバー率 (PAPER ベースでのカバー率) 0

    0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0 200000 400000 600000 800000 1000000 1200000 1400000 198119821983198419851986198719881989199019911992199319941995199619971998199920002001200220032004200520062007200820092010201120122013201420152016 orcid_id total coverage Source: Web of Science XML Core Collection ※. 著者数は整数カウント
  23. 研究者単位で名寄せをするいくつかの方法(2) : WOS/RESEARCHER ID-PUBLONS  Web of Science ResearcherID is

    a unique identifier for researchers on Publons. Register on Publons and import your publications from the Web of Science to become eligible for a Web of Science ResearcherID.  Each night, Publons assigns a Web of Science ResearcherID to any profiles with one or more Web of Science-indexed publications that do not yet have a ResearcherID.  Any publications you add to your Publons profile will then be linked to your Web of Science ResearcherID when anyone searches for you on Web of Science. Please allow up to two weeks for changes you make on Publons to be reflected on Web of Science. https://publons.freshdesk.com/support/solutions/articles/12000038281-what-is- my-web-of-science-researcherid-
  24. 研究者単位で名寄せをするいくつかの方法(3); DAIS ID  This system disambiguates authors in the

    Web of Science Core collection. It assigns author ids to the authorships of papers.  There are four major components to DAIS  Initial Clustering – Starting from scratch, take our whole database without an authority list of known authors, identify the different authors.  Ongoing – As new data comes into the database, assign author ids.  RID Integration – Integrates manually created publication lists with DAIS  Reevaluation – Does a fresh, full clustering on a per name basis; discovers new authors not known at the time of the initial clustering
  25. WEB OF SCIENCE における; DAIS ID のカバー率 0 0.1 0.2

    0.3 0.4 0.5 0.6 0.7 0.8 0 2000000 4000000 6000000 8000000 10000000 12000000 14000000 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 総件数 dais_id カバー率 Source: Web of Science XML Core Collection ※. 著者数は整数カウント
  26. 研究者単位で名寄せをする方法(4): SCOPUS/AUTHOR ID  Scopus Author ID  Scopus Author

    ID is an author ID that Scopus automatically assigns to each author in its database to group publications of the same author together. For the set of documents grouped under the profile of an author ID, Scopus provides bibliometric information such as citation counts, h-index, and h-graph via its citation overview function. Scopus Author ID is now ORCID compliant.  結局, 複数の Author ID が単一の研究者に紐づけられている可能性がある  “Because of author name ambiguity issues and other reasons such as prior affiliations, the automatic matching algorithm of Scopus may generate another new ID for the same author when a new paper is included in the database. ” https://libguides.library.cityu.edu.hk/aim/scopus
  27. 研究者単位で名寄せをする方法(5): MICROSOFT ACADEMICS/AUTHOR ID  Microsoft Academics  “We teach

    our machine to mimic how we need to tell one John Smith from another: run a few search queries. This is particularly feasible because we sit on top of Bing that has indexed many CVs and user homepages that can provide valuable clues. With the entire web at our disposable, we are able to group authors together when doing so will contribute to less than 3% of errors. For more details, please see our January 2018 blog.”  利用している情報  information about author affiliation, publication venues, and co-author network.  Our data scientists have developed a method for mining data from authors’ web sites and online CVs. Taking advantage of Microsoft’s web-scale infrastructure, by analyzing billions of documents found on the web, the team has taught the machine to recognize web pages that belong to researchers or may be CVs. https://www.microsoft.com/en-us/research/project/academic/articles/microsoft- academic-uses-knowledge-address-problem-conflation-disambiguation/
  28. 研究者単位で名寄せをする方法(6): LENS.ORG/AUTHOR IDENTIFERS  Lens.org – 論文と特許を集約したデータベース, サイエンスリンケージ (特許の非特許引用) も参照可能

     Scholar (論文データ) には Author Identifiers を用意  “By default, author values are grouped by their display name, which can result in the aggregation of scholarly works from different authors with the same name. Enabling author identifiers uses the identifiers available in our data sources to group authors, which can help disambiguate different authors with the same name. The author identifiers used currently include Microsoft Academic, and ORCID identifiers if they are available in data from CrossRef or PubMed.  N.B. Author disambiguation algorithms can incorrectly assign more than one identifier for the same person. In this case, you may wish to disable this feature to match purely on name alone, or select the different identifiers belonging to an individual author.  実質的には, Microsoft Academics の Author ID を利用  ”
  29. まとめ 著者ID OrcID Researcher ID DAIS ID Author ID(Elsevier) Author

    ID(Microsoft) Author Identifers Type Non-Proft Profit Profit Proft Profit Non-profit 運営主体 Orcid.org Clarivate Analytics Clarivate Analytics Elsevier Microsoft Lens.org(Cambia Health Solutions and Queensland University of Technology) 価格 無償 Web of Science の利用 は有償 Web of Science の利用 は有償 Scopus の利用は有償 無償 無償 登録方法 研究者個人 が登録 Publons 登録後, Web of Science に採録された書 誌情報を整理 管理用の名寄せアルゴ リズム 書誌情報採録時 Scopus/Elsevier によって アサインされる著者ID. Microsoft Academic にて提 供される名寄せされた著 者セット. 著者本人のホー ムページ, CV などの情報 を用いて名寄せ. 研究者自 身が名寄せ情報を修正す ることは可能 Microsoft Academicや Pubmed などを ベースにした論文データベース. カバー率お よび名寄せ 精度 直近は高い, 古い年代は カバー率が 低い 古い年代はカバー率が 高い 古い年代はカバー率が 高い カバレッジは高いが, 所 属機関などの変遷が追 えていない Microsoft 発表によれば3 パーセント以下 Microsoft Academic ID に Pubmed や orcid の情報をappend して精度を向 上 URL https://orcid .org/ https://publons.com/abo ut/home/ https://www.webofknowl edge.com https://www.scopus.com/ https://academic.microsoft.co m/home https://www.lens.org/
  30. 国立大学の生産性分析  Web of Science XML Data とNISTEP Harmonization テーブルを用いて,

    日本の大学の生産性(論文生産数, 被引用数) について比較する
  31. PARAMETER  Organization_id; NISTEP が名寄せした部局単位のID  Parent_organization; 親組織名  ESI;

    Clarivate Analytics による科学分類  Seq_Classification; 組織分類  国立大学, 私立大学, 高専, 企業などが分類済み  Publication Year; 論文の公刊年  Numofpublication; 当該部局がt年に公刊した論文数  Numofforwardcitation; 当該部局がt年に公刊した前方引用数  Numofbackwardcitation; 当該部局がt年に公刊した後方引用数
  32. ESI 科学分類  “Essential Science Indicatorsは、Web of Science Core Collectionの最近10

    年間のレコードを22の 検索可能な研究分野で分析しているデータで す。レコードは2か月ごとに更新しています。  22分野の内訳は下記の通りです。なお、ESIの カテゴリーは、Web of Science Core Collection もしくは、Journal Citation Reportsの分野とは異 なります。 基本的にジャーナル毎に22分野に 分類されています。“  分類  Agricultural Science Biology & Biochemistry Chemistry Clinical Medicine Computer Science Economics & Business Engineering Environment/ Ecology Geosciences Immunology Materials Science Mathematics Microbiology Molecular Biology & Genetics Multidisciplinary * Neuroscience & Behavior Pharmacology Physics Plant & Animal Science Psychiatry/Psychology Social Sciences--general Space Science https://support.clarivate.com/ScientificandAcademicResearch/s/ article/000004962?language=ja
  33. 論文数の増加 (WEB OF SCIENCE とSCOPUS) 0 0.2 0.4 0.6 0.8

    1 1.2 1.4 500000 1000000 1500000 2000000 2500000 3000000 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 web of science scopus coverage
  34. やるべきこと (TODO LIST)  SPIAS や論文データベース, CSTI エビデンスシステム(仮称) など, 研究者の総合的な評価を行うため

    のプラットフォームは充実しつつある  研究者のジェンダーギャップを測定するためには、名前 (first name) データが必要。米国の場合は Open Data として存在するが、日本の場合公的データとしてはあまり存在していない. 現時点では, 民間による整備データを調達する必要がある  これにより、日本語で記述された特許および論文データのジェンダー分析が可能になる
  35. アナウンスメント データサイエンスな講義資料をこちらのURLで公開して います; https://speakerdeck.com/yasushihara/  スターサイエンティスト研究に興味のある方  早稲田牧研究室か僕までご連絡を  https://www.kanetaka-maki.org/

     企業データベースの解析に興味のある方  一橋TDB-CAREEか僕までご連絡を  http://www7.econ.hit-u.ac.jp/tdb-caree/  ノーベル賞研究に興味のある方  NISTEP赤池フェローか僕までご連絡を  科学技術イノベーションの解析に興味のある方  GRIPS SciREX センターか僕までご連絡を  https://scirex.grips.ac.jp/
  36. REFERENCES  塚田尚稔 ・元橋一之 (2018) Microsoft Academic Graph の書誌情報データとしての評価, NISTEP

    Discussion Paper, 162, http://hdl.handle.net/11035/3215  Hussain, I., Asghar, S. (2017) A survey of author name disambiguation techniques: 2010–2016, The Knowledge Engineering Review, 32, e22.  Li, Guan-Cheng & Lai, Ronald & D’Amour, Alexander & Doolin, David M. & Sun, Ye & Torvik, Vetle I. & Yu, Amy Z. & Fleming, Lee. (2014) Disambiguation and co-authorship networks of the U.S. patent inventor database (1975–2010), Research Policy, Elsevier, 43, 6, pp.941-955.
  37. REFERENCES  Jacques Mairesse, Michele Pezzoni (2015) Does Gender Affect

    Scientific Productivity ? A Critical Review of the Empirical Evidence and a Panel Data Econometric Analysis for French Physicists, Revue économique, 66, pp.65-113., https://www.cairn.info/revue-economique-2015-1-page-65.htm  On-line appendixes to “PROGRESS AND POTENTIAL: A profile of women inventors on U.S. patents”, http://data.patentsview.org/documents/On-line+Appendix+- +Gender+Attribution+of+USPTO+Inventors.pdf
  38. ACKNOWLEDGEMENTS  一橋大学大学院経済学研究科 帝国データバンク企業・経済高度実証研究センター (TDB-CAREE)  JST/RISTEX  「スターサイエンティストと日本のイノベーション」 

    「イノベーションの科学的源泉とその経済的効果」  政策研究大学院大学 (GRIPS) 科学技術イノベーション政策研究センター (SciREX センター)