Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
パターンを見極めて文字を操ろう!
Search
UiPath Friends
May 23, 2023
Business
150
0
Share
パターンを見極めて文字を操ろう!
UiPath Friends
May 23, 2023
More Decks by UiPath Friends
See All by UiPath Friends
Orchestrator Manager使ってみた
uipathfriends
0
580
市民開発&社内コミュニティ推進トーク
uipathfriends
0
280
グローバルハッカソン体験談
uipathfriends
0
120
UiPathの副業市場
uipathfriends
0
150
UiPathは世界を笑顔にする
uipathfriends
0
110
Autopilotやってみた
uipathfriends
0
920
AI at Workが切り拓くオートメーションの未来とカスタマーストーリー
uipathfriends
0
130
UiPathの教育的効果の再考_がっきー
uipathfriends
0
90
IT未経験からITエンジニアへ_田口凌雅
uipathfriends
0
180
Other Decks in Business
See All in Business
2025年度「海の家プロジェクト」ピッチ資料
brush2026
0
140
Webinar 30.04.2026 La nueva regulación del sector eléctrico
neuroenergia
PRO
0
410
哲学ドリブン開発の全体像 ── 同じプロンプトで出力が変わるとき、何が起きているのか~Philosophy as Code
makitotashiro
0
150
株式会社ELYZA(イライザ) 採用情報資料 / RECRUIT PITCH
elyza
2
750k
Product Management Summit 2026 リチェルカ登壇資料『PdMを廃止しました。』
recerqainc
6
9.3k
Speee_2026年9月期第2四半期 決算説明資料
speee_pr
0
3k
モベンシス会社紹介資料
movensys
0
1.5k
中期経営計画2027
buyselltechnologies
0
400
会社紹介資料
gatechnologies
2
170k
HubSpot Breeze アシスタント 業務で活用するための基礎知識
somanishioka
0
120
株式会社アシスト_会社紹介資料
ashisuto_career
3
170k
ties|クラウド顧客・案件管理システム - サービスのご紹介
so_kotani
2
750
Featured
See All Featured
Amusing Abliteration
ianozsvald
1
170
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
810
Art, The Web, and Tiny UX
lynnandtonic
304
21k
Code Review Best Practice
trishagee
74
20k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
380
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.9k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
190
A designer walks into a library…
pauljervisheath
211
24k
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
140
Writing Fast Ruby
sferik
630
63k
sira's awesome portfolio website redesign presentation
elsirapls
0
250
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
9.9k
Transcript
パターンを 極めて文 を 操ろう! Presented by wakcy
自己紹介 Friends Name: Wacky(ワッキー) UiPath 歴: 4年半 RPA/UiPathFriendsとの関わり: UiPathサービスパートナー企業にて開発を始め、 プリセールス、プロジェクトマネージメントを経て、
現在、転職先にて社内の業務自動化の推進・運営に携わっております。 趣味:湯活・サ活 Twitter: @W_Wacky20
ライブコーディングのお題: PDFのデータ抽出をしてみよう! 需要③:電帳法の改正 でPDFのデータ抽出作 業増えた 需要①: PDFは便利だ から。使用するお客さん 多い 需要②:内の業界は
Word/PDF文化なんだ よね
PDFの文字データを構造的なデータに… こんな風なお悩みありませんか? ・実現可否判断はスキャンデータ以外はどこで判断するの? ・会社のセキュリティー上、AIやCV,DUは使えない… ・正規表現や難しい関数使わなくちゃだめ? そもそも、文字の羅 列ばかり… ぐぬぬっ… 大丈夫! 厚切りなWacky
です! ドキュメントには、 Uh‐huh!! Patternがあるね!
目的と安心ポイント ・成るべくStudioのみ使って行います ・易しめのVB関数やLinqを使用します ・正規表現の多用は控えます ・お時間の関係で、まずはデータ抽出だけにフォーカスを当て ます 【目的】 今後PDFからデータ抽出の実現可否検証で役立ててください 【安心ポイント】
自動化シナリオ 法人登記簿(見本)から下記抽出対象データを取得しExcel にまとめる 【抽出対象】 商号・本店・会社法人等番号と代表者の住所・氏名
まとめ ・必要なデータへたどり着く最短ルートは不用な文字や文章はバッサ リ切り捨てましょう ・不変文字情報の特徴を起点に文字の区切り位置、データの区切 り位置を見極めましょう ・自身が分かりやすい目印などを入れてデータを区切りましょう