Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Optimizing Electric Journal Subscriptions via Integer Programs

Shunji Umetani
December 17, 2022

Optimizing Electric Journal Subscriptions via Integer Programs

最近,多くの国立大学では大手出版社との包括契約の維持が困難となりつつあり,そのような状況において教育研究活動に必要な電子ジャーナルの購読を維持することが重要な課題となっている.本講演では,数理最適化手法を用いて与えられた予算の下で購読する電子ジャーナルの適切な組み合わせを決定する方法を提案する.

Shunji Umetani

December 17, 2022
Tweet

More Decks by Shunji Umetani

Other Decks in Research

Transcript

  1. 発表の概要 •  電⼦ジャーナルの包括契約からタイトル毎の個別契約への移⾏ によって⽣じる諸問題の解決 •  電⼦ジャーナルの現状と課題 –  学術雑誌の価格⾼騰と包括契約(ビッグディール)の問題点 •  包括契約から個別契約への移⾏によって⽣じる影響*

    –  ⼤⼿出版社A社,B社の購読計画(H27年度) –  個⼈によるペイパービュー(PPV)購⼊の影響 •  公平かつ満⾜度の⾼い購読計画案の効率的な作成* –  数理最適化による購読計画案の作成 –  ダウンロード可能数の最⼤化,最⼩充⾜率の最⼤化 –  複数出版社の購読計画の同時作成,組織によるPPVの事前購⼊ 2 *各タイトルの分野,H27年度の購読費,H26年度のダウンロード数をデータとして利⽤ 数理最適化で作成した案を叩き台に⽤いることで 電⼦ジャーナル購読計画の決定に要する⼿間を削減
  2. 電⼦ジャーナルの現状と問題点 •  学術雑誌の価格⾼騰 –  ⾃然科学系分野の2004年から2015年の平均値上げ率は毎年5.9% –  競合商品がないため価格競争が⽣じない,少数の出版社による独 占,掲載論⽂数の増加や付加サービスによるコスト増など 3 $0

    $500 $1,000 $1,500 $2,000 $2,500 $3,000 $3,500 $4,000 $4,500 $5,000 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 Agriculture Astronomy Biology Botany Chemistry Engineering Food Science General Science Geography Geology Health Sciences Math & Computer Science Physics Technology Zoology [Library Journal Periodicals Price Survey 2004-2015]
  3. 電⼦ジャーナルの現状と問題点 •  電⼦ジャーナルの急速な普及 –  ⼤阪⼤学では年間380万アクセス,教員・学⽣(2.8万⼈)が年1⼈ 当り平均136回利⽤ –  電⼦情報基盤資料の整備事業により,教員個⼈(もしくは研究室)で はなく⼤学全体(図書館)が電⼦ジャーナルを購⼊ • 

    包括契約(ビッグディール)の問題点 –  契約開始時の契約額にわずかな追加料⾦を⽀払うだけで,全タイ トルのアクセスが可能に → 利⽤可能なタイトル数が⾶躍的に増⼤ –  出版社主導の値上げに⼤学が従わざるを得ない状況に –  東邦⼤学では包括契約からタイトル毎の個別契約とPPVの組み合わ せに移⾏することで23%の費⽤削減を実現 [吉⽥,2008] 4 運営費交付⾦の削減が続く国⽴⼤学にとって購読額が 上昇し続ける包括契約を維持し続けることは困難
  4. ⼤阪⼤学の現状 •  A社,B社ともにH26年度まで包括契約 •  A社はH27年度,B社はH28年度(予定)に個別契約に移⾏ –  H27年度:予算総額*の50%までダウンロード単価の安い順にタイ トルを選定し,残りは購読希望アンケートの結果に従って選定 –  H28年度:各部局に予算を配分してタイトルを選定(部局間で調整

    して共同購⼊を申し出ることも可能) •  各タイトルの分野(A社:20分野,B社:11分野),H27年度の 各タイトルの購読額,H26年度のダウンロード数をデータとし て利⽤* •  充⾜率(%)=(ダウンロード可能数 / H26年度:ダウンロード 数)×100 を評価 5 *⼤阪⼤学では「電⼦的情報基盤整備費」(全学強化経費+部局負担)にて電⼦ジャーナル を購読している *H26年度の各タイトルの購読額,H25年度,H24年度のダウンロード数などのデータ も利⽤可能
  5. H27年度:A社の購読計画 •  予算総額の50%までダウンロード単価の安い順にタイトルを選 定し,残りは購読希望アンケートの結果に従って選定 •  契約タイトル数:全タイトルの22.79% •  ダウンロード可能数:H26年度ダウンロード数の66.05% 6 0

    25000 50000 75000 100000 125000 150000 175000 200000 Veterinary Science and Veterinary Medicine Social and Behavioral Sciences Physics and Astronomy Pharmacology, Pharmaceutical Science and Toxicology Nursing Neuroscience Medicine Mathematics Materials Science Life Sciences Health Professions Environmental Sciences Engineering, Energy and Technology Economics, Business and Management Earth and Planetary Sciences Dentistry Computer Science Chemistry and Chemical Engineering Arts and Humanities Agricultural and Biological Sciences # of downloaded papers in the last year # of avairable papers in this year
  6. H27年度:A社の購読計画 •  予算総額の50%までダウンロード単価の安い順にタイトルを選 定し,残りは購読希望アンケートの結果に従って選定 •  契約タイトル数:全タイトルの22.79% •  ダウンロード可能数:H26年度ダウンロード数の66.05% 7 0%

    10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Veterinary Science and Veterinary Medicine Social and Behavioral Sciences Physics and Astronomy Pharmacology, Pharmaceutical Science and Toxicology Nursing Neuroscience Medicine Mathematics Materials Science Life Sciences Health Professions Environmental Sciences Engineering, Energy and Technology Economics, Business and Management Earth and Planetary Sciences Dentistry Computer Science Chemistry and Chemical Engineering Arts and Humanities Agricultural and Biological Sciences
  7. 包括契約前のB社の購読計画 •  包括契約前の購読タイトルをそのまま採⽤した場合の充⾜率 •  契約タイトル数:全タイトルの14.80% •  ダウンロード可能数:H26年度ダウンロード数の40.15% 8 0 5000

    10000 15000 20000 25000 30000 35000 40000 45000 50000 Physics and Astronomy Medicine Mathematics and Statistics Humanities, Social Sciences and Law Engineering Earth and Environmental Science Computer Science Chemistry and Materials Science Business and Economics Biomedical and Life Sciences Behavioral Science # of downloaded papers in the last year # of avairable papers in this year
  8. 包括契約前のB社の購読計画 •  包括契約前の購読タイトルをそのまま採⽤した場合の充⾜率 •  契約タイトル数:全タイトルの14.80% •  ダウンロード可能数:H26年度ダウンロード数の40.15% 9 0% 10%

    20% 30% 40% 50% 60% 70% 80% 90% 100% Physics and Astronomy Medicine Mathematics and Statistics Humanities, Social Sciences and Law Engineering Earth and Environmental Science Computer Science Chemistry and Materials Science Business and Economics Biomedical and Life Sciences Behavioral Science
  9. H27年度の購読計画 •  分野による充⾜率の偏りが⼤きい –  ⾃然科学分野はダウンロード単価の安いタイトルが多く,充⾜率* が⾼くなる傾向にある •  未契約タイトルの論⽂を個⼈でPPV購⼊すると⽀払い額が増加 –  個別契約でダウンロードできなかった33.95%の論⽂を個⼈でPPV

    購⼊すると,A社の⽀払い総額はH26年度の約6.49倍*になる –  個⼈のPPVに切り替わると購読を控えると予想されるが,それでも 1/10に当たる3.39%の論⽂を個⼈でPPV購⼊すると,A社への⽀ 払い総額はH26年度の約1.24倍*になる –  各教員が1⼈当り年間約10本をPPV購⼊するならば,その費⽤を 電⼦的情報基盤整備費に回すことで包括契約を維持できる 10 *充⾜率(%)=(ダウンロード可能数 / H26年度:ダウンロード数)×100 *組織でPPVを事前購⼊するとボリュームディスカウントが⽣じる. この場合には約3.30倍,約1.23倍となる. 個⼈のペイパービュー購読は⽀払額の抑制には繋がらない
  10. H28年度の購読計画 •  各部局に予算を配分してタイトルを選定(部局間で調整して共同購⼊を 申し出ることも可能) •  ダウンロード単価の安いタイトルは⾼額な場合が少なくない •  ダウンロード数の多いタイトルは利⽤者が多く調整が⼤変 –  例:OR分野のある論⽂誌は専攻での単独購⼊が難しい上に,

    DL数も2688回と利⽤者が多く共同購⼊の調整は容易ではない 11 0 500000 1000000 1500000 2000000 2500000 0 1000 2000 3000 4000 5000 Price (yen) Price per downloads (yen) DL単価が安い & ⾼額 → DL数多い → 利⽤者が多い 各部局は⾼額なタイトルを 敬遠して,配分予算内で購 ⼊できるニッチなタイトル ばかり選択する.
  11. 数理最適化による購読計画案の作成 •  公平かつ満⾜度の⾼い購読計画案を作成したい •  与えられた予算の下で購読タイトルを選定する問題を数理最適 化モデルに定式化し,商⽤ソフトウェアにて求解* •  定式化: –  ダウンロード数の最⼤化

    →全体の充⾜率の限界値 –  最⼩充⾜率の最⼤化 →分野による偏りのない現実的な解 –  組織によるPPVの事前購⼊を考慮した最⼩充⾜率の最⼤化 •  適⽤例: –  H27年度:A社, B社, A社+B社 12 *今回はGurobi Optimizer6.5.0を利⽤
  12. ダウンロード数の最⼤化 •  予算制約の下でダウンロード数を最⼤化する最適化問題 •  ナップサック問題:ダウンロード単価が安いタイトルから 順に選ぶ貪欲法は良い近似解法として知られる 13 タイトルの集合 タイトル j

    のダウンロード数(H26年度) タイトル j の購読額(H27年度) 予算総額 タイトル j を購読なら1,そうでなければ0 変数 A誌:12万円,40回 (DL単価:3000円) B誌:2万円,20回 (DL単価:1000円) C誌:1万円,20回 (DL単価:500円) D誌:1万円,10回 (DL単価:1000円) E誌:4万円,100回 (DL単価:400円) 予算:15万円
  13. H27年度:A社の計算結果 •  全体の充⾜率は66.05%→75.50%と⼤幅に向上 •  分野による偏りは相変わらず⼤きい •  契約タイトル数:全タイトルの23.48% •  ダウンロード可能数:H26年度ダウンロード数の75.50% 14

    0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Veterinary Science and Veterinary Medicine Social and Behavioral Sciences Physics and Astronomy Pharmacology, Pharmaceutical Science and Toxicology Nursing Neuroscience Medicine Mathematics Materials Science Life Sciences Health Professions Environmental Sciences Engineering, Energy and Technology Economics, Business and Management Earth and Planetary Sciences Dentistry Computer Science Chemistry and Chemical Engineering Arts and Humanities Agricultural and Biological Sciences
  14. H27年度:B社の計算結果 •  全体の充⾜率は40.15%*→61.45%と⼤幅に向上 •  分野による偏りが⼤きい •  契約タイトル数:全タイトルの20.13% •  ダウンロード可能数:H26年度ダウンロード数の61.45% 15

    *包括契約前の購読タイトルをそのまま採⽤した場合の全体の充⾜率 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Physics and Astronomy Medicine Mathematics and Statistics Humanities, Social Sciences and Law Engineering Earth and Environmental Science Computer Science Chemistry and Materials Science Business and Economics Biomedical and Life Sciences Behavioral Science
  15. 最⼩充⾜率の最⼤化 •  分野毎に充⾜率*を算出してそれらの最⼩値を最⼤化 •  分野毎の購読タイトルの充⾜率がz以上とする制約を追加 し,⽬的関数でzを最⼤化 •  整数線形計画問題:厳密な最適解を短時間で求めようとす ると莫⼤な計算時間を要する場合は少なくない 16

    •  分野毎に充⾜率*を算出してそれらの最⼩値を最⼤化 •  分野毎の購読タイトルの充⾜率がz以上とする制約を追加 し,⽬的関数でzを最⼤化 •  整数線形計画問題:厳密な最適解を短時間で求めようとす ると莫⼤な計算時間を要する場合は少なくない タイトルの集合 タイトル j のダウンロード数(H26年度) タイトル j の購読額 予算総額 タイトル j を購読なら1,そうでなければ0 分野の集合 分野 i に含まれるタイトルの集合 分野 i に含まれるタイトルの集合 充⾜率の最⼩値 変数 *充⾜率(%)=(ダウンロード可能数 / H26年度:ダウンロード数)×100
  16. H27年度:A社の計算結果 •  全体の充⾜率は66.05%→70.50%と向上 •  最⼩充⾜率も68.87%と分野による偏りを⼤幅に軽減 •  契約タイトル数:全タイトルの24.27% •  ダウンロード可能数:H26年度ダウンロード数の70.50% 18

    0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Veterinary Science and Veterinary Medicine Social and Behavioral Sciences Physics and Astronomy Pharmacology, Pharmaceutical Science and Toxicology Nursing Neuroscience Medicine Mathematics Materials Science Life Sciences Health Professions Environmental Sciences Engineering, Energy and Technology Economics, Business and Management Earth and Planetary Sciences Dentistry Computer Science Chemistry and Chemical Engineering Arts and Humanities Agricultural and Biological Sciences
  17. H27年度:B社の計算結果 •  全体の充⾜率は40.15%*→59.38%と向上 •  最⼩充⾜率も58.47%と分野による偏りを⼤幅に軽減 •  契約タイトル数:全タイトル数の21.67% •  ダウンロード可能数:H26年度ダウンロード数の59.38% 19

    0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Physics and Astronomy Medicine Mathematics and Statistics Humanities, Social Sciences and Law Engineering Earth and Environmental Science Computer Science Chemistry and Materials Science Business and Economics Biomedical and Life Sciences Behavioral Science *包括契約前の購読タイトルをそのまま採⽤した場合の全体の充⾜率
  18. H27年度:A社+B社の計算結果 •  複数の出版社について同時に計算すれば適切な予算配分も可能 •  最⼩充⾜率を最⼤化すると全体の充⾜率は67.26% •  契約タイトル数:全タイトルの29.00% •  ダウンロード可能数:H26年度ダウンロード数の67.26% 20

    0% 20% 40% 60% 80% 100% Veterinary Science and Veterinary Social and Behavioral Sciences Physics and Astronomy Pharmacology, Pharmaceutical Nursing Neuroscience Medicine Mathematics Materials Science Life Sciences Health Professions Environmental Sciences Engineering, Energy and Economics, Business and Earth and Planetary Sciences Dentistry Computer Science Chemistry and Chemical Arts and Humanities 0% 20% 40% 60% 80% 100% Physics and Astronomy Medicine Mathematics and Statistics Humanities, Social Sciences and Engineering Earth and Environmental Science Computer Science Chemistry and Materials Science Business and Economics Biomedical and Life Sciences Behavioral Science Agricultural and Biological A社の予算割合:73.64% → 67.32% B社の予算割合:26.36% → 32.68%
  19. 組織によるペイパービューの事前購⼊ •  ペイパービューを事前購⼊するとボリュームディスカウントに よりダウンロード単価が⼤幅に下がる •  ペイパービューの単価はトークン(ダウンロード権)購⼊数に対 する階段関数となる 21 タイトルの集合 タイトル

    j のダウンロード数(H26年度) タイトル j の購読⾦額 予算総額 タイトル j を購読なら1,そうでなければ0 分野の集合 分野 i に含まれるタイトルの集合 分野 i に含まれるタイトルの集合 充⾜率の最⼩値 ペイパービューの購⼊数 ペイパービューの単価を決める0-1変数 分野 i に割り当てるペイパービューの数 変数
  20. H27年度:A社の計算結果 •  全体の充⾜率は70.50%→71.59%,最⼩充⾜率は68.87% →69.45%と少し向上,PPVのダウンロード数は全体の0.90% •  契約タイトル数:全タイトルの26.83% •  ダウンロード可能数:H26年度のダウンロード数の71.59%* 22 0%

    10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Veterinary Science and Veterinary Medicine Social and Behavioral Sciences Physics and Astronomy Pharmacology, Pharmaceutical Science and Toxicology Nursing Neuroscience Medicine Mathematics Materials Science Life Sciences Health Professions Environmental Sciences Engineering, Energy and Technology Economics, Business and Management Earth and Planetary Sciences Dentistry Computer Science Chemistry and Chemical Engineering Arts and Humanities Agricultural and Biological Sciences download via title subscription download via pay-per-view *PPV購⼊のみだとH26年度のダウンロード数の14.77%しか充⾜できない.
  21. 個別契約とペイパービューの併⽤ •  充⾜率を評価するとペイパービューの導⼊の効果は⼤きくない •  未契約のタイトルがあれば,少なくない数のペイパービューの 利⽤は必ず⽣じるため,事前購⼊によるボリュームディスカウ ントの効果は⼤きい •  個⼈のペイバービューは⽴替払いをともなうので事務の負担は 少なくない

    → 組織で事前購⼊することで事務の負担を軽減 •  ペイパービューはダウンロードした本⼈しか閲覧できない •  購⼊したトークン(ダウンロード権)の管理⽅法は? •  ペイパービューの事前購⼊の適切な数は? •  ペイパービューの購⼊費は誰が負担する? 23 組織によるペイパービュー事前購⼊は効果的だが 導⼊に際していくつか解決すべき問題がある
  22. まとめ •  電⼦ジャーナルの包括契約からタイトル毎の個別契約への切替 えによって⽣じる諸問題の解決 •  包括契約から個別契約への切替えによって⽣じる影響 –  分野による充⾜率の偏りが⼤きい –  個⼈のペイパービューが増えると出版社への⽀払いが増える

    –  ダウンロード数の多いタイトルは利⽤者が多く調整が⼤変 •  数理最適化による公平かつ満⾜度の⾼い購読計画案の作成 –  ダウンロード数の最⼤化 → 全体の充⾜率を向上 –  最⼩充⾜率の最⼤化 → 分野による充⾜率の偏りを⼤幅に削減 –  複数の出版社の購読計画案を同時に作成すれば予算配分も可能 –  組織によるペイパービューの事前購⼊は効果的だが導⼊に際して いくつか解決すべき問題がある 24 数理最適化で作成した案を叩き台に⽤いることで 電⼦ジャーナル購読計画の決定に要する⼿間を削減
  23. 参考⽂献 1.  吉⽥杏⼦,東邦⼤学における外国雑誌価格⾼騰への対応,薬学 図書館,57 (2012),25-30. 2.  ⽯井道悦,電⼦ジャーナルと学術機関リポジトリ:⼤阪⼤学の 現状と課題,2012. 3.  ⾼橋努,⼤学図書館から⾒た電⼦ジャーナルの現状と課題,電

    ⼦情報通信学会誌,95 (2012), 27-32. 4.  古⻄真,研究基盤としての電⼦ジャーナル ―電⼦ジャーナル へのアクセスの維持を⽬指して―,科学技術動向,2011. 5.  尾城孝⼀,ビッグディールは⼤学にとって最適な契約モデル か?,SPARC Japan News Letter,2010. 25 *英語の関連⽂献も多数ありますが只今サーベイ中にて掲載していません.