Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文「Sentence Boundary Detection in Legal Text」のまとめ
Search
sunao11
September 15, 2020
Technology
1
140
論文「Sentence Boundary Detection in Legal Text」のまとめ
論文「Sentence Boundary Detection in Legal Text」のまとめです。
法律文書をセンテンスで区切る場合に、通常の自然言語処理と違うアプローチを行います。
sunao11
September 15, 2020
Tweet
Share
More Decks by sunao11
See All by sunao11
一般社団法人のガバナンスー一般社団法人民事推進センターの社員の除名を経験してー
sunao11
0
110
シビックテックフォーラム2021の運営委員からの退会勧奨と事前報告に対する不意打ち、無視、スパム認定。シビックテック(自らの手で社会課題解決、DIY都市、自発的に、ソーシャルグッド)
sunao11
1
45
シビックテックフォーラム2021の運営委員からの退会勧奨と事前報告に対する不意打ち、無視、スパム認定。シビックテック(自らの手で社会課題解決、DIY都市、自発的に、ソーシャルグッド)。
sunao11
1
46
論文まとめ:SoftPoolNet: Shape Descriptor for Point Cloud Completion and Classification
sunao11
0
150
論文Title:Privacy Preserving Structure -from-Motionのまとめ
sunao11
0
130
論文タイトル:DeepSFM: Structure From Motion Via Deep Bundle Adjustmentのまとめ
sunao11
1
180
渉外司法書士のための金融法務と海外送金 研修受講メモ
sunao11
1
98
自筆証書遺言書保管制度についてのQ&A(試訳) Q&A about self-signed will testamentary keeping system.(The trial translation)
sunao11
0
89
商業登記所における法人の実質的支配者 情報の把握促進に関する研究会~有識者 による議論の取りまとめ~(試訳)
sunao11
1
72
Other Decks in Technology
See All in Technology
OCI Oracle Database Services新機能アップデート(2025/03-2025/05)
oracle4engineer
PRO
1
140
菸酒生在 LINE Taiwan 的後端雙刀流
line_developers_tw
PRO
0
130
RubyOnRailsOnDevin+α / DevinMeetupJapan#2
ginkouno
0
330
成立するElixirの再束縛(再代入)可という選択
kubell_hr
0
240
API の仕様から紐解く「MCP 入門」 ~MCP の「コンテキスト」って何だ?~
cdataj
0
150
AIにどこまで任せる?実務で使える(かもしれない)AIエージェント設計の考え方
har1101
3
1k
今からでも間に合う! 生成AI「RAG」再入門 / Re-introduction to RAG in Generative AI
hideakiaoyagi
1
160
New Cache Hierarchy for Container Images and OCI Artifacts in Kubernetes Clusters using Containerd / KubeCon + CloudNativeCon Japan
pfn
PRO
0
150
ObsidianをMCP連携させてみる
ttnyt8701
2
110
エンジニア採用から始まる技術広報と組織づくり/202506lt
nishiuma
8
1.6k
Devin(Deep) Wiki/Searchの活用で変わる開発の世界観/devin-wiki-search-impact
tomoki10
0
310
白金鉱業Meetup_Vol.19_PoCはデモで語れ!顧客の本音とインサイトを引き出すソリューション構築
brainpadpr
2
310
Featured
See All Featured
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
657
60k
StorybookのUI Testing Handbookを読んだ
zakiyama
30
5.8k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
123
52k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Agile that works and the tools we love
rasmusluckow
329
21k
Mobile First: as difficult as doing things right
swwweet
223
9.6k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.5k
Visualization
eitanlees
146
16k
How GitHub (no longer) Works
holman
314
140k
The Cult of Friendly URLs
andyhume
79
6.4k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
16
920
Optimising Largest Contentful Paint
csswizardry
37
3.3k
Transcript
Title:Sentence Boundary Detection in Legal Text ・一般的に使用されている半教師付きとルールベースのライブラリ、および 2つの教師付きシーケンスラベリングア プローチを提案 まとめた人:宮城直
提案手法・新規性 ・略語リスト、文頭ラベル、文末ラベルなどを追加 し更新することで,精度を改善
結果 ・Punkt(PunktSentenceTokenizer)モデルの更新前と更新後( カスタム略語を追加して学習) の比較 ・実験の精度(Precision), 再現率(Recall), 加重平均(F1-score), 要素数(Support) 図
Oral結果 ・CRF(Conditional random field)モデルアプローチが現在、実用的なアプローチ ・完全教師付きアプローチが半教師付きルールライブラリよりも優れている
+αの情報 ・George Sanchez[https://scholar.google.com/citations?user=Gk65NcEAAAAJ&hl=en], Thomson Reuters R&D,610 Opperman Dr. Eagan, MN
55123 ・データセット:[https://github.com/jsavelka/sbd_adjudicatory_dec / tree / master / data_set] [bva.json、cyber_crime.json、intellectual_property.json、scotus.json]