Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
パターンを見極めて文字を操ろう!
Search
UiPath Friends
May 23, 2023
Business
0
150
パターンを見極めて文字を操ろう!
UiPath Friends
May 23, 2023
Tweet
Share
More Decks by UiPath Friends
See All by UiPath Friends
Orchestrator Manager使ってみた
uipathfriends
0
520
市民開発&社内コミュニティ推進トーク
uipathfriends
0
270
グローバルハッカソン体験談
uipathfriends
0
98
UiPathの副業市場
uipathfriends
0
130
UiPathは世界を笑顔にする
uipathfriends
0
86
Autopilotやってみた
uipathfriends
0
880
AI at Workが切り拓くオートメーションの未来とカスタマーストーリー
uipathfriends
0
100
UiPathの教育的効果の再考_がっきー
uipathfriends
0
69
IT未経験からITエンジニアへ_田口凌雅
uipathfriends
0
160
Other Decks in Business
See All in Business
目標の50記事を達成したわけだが
suzuki_tada
1
160
未経験PdM40%のプロダクトマネージャー組織を作った過程でわかった再現性について
numashi
1
760
なぜ、あのPdMは「時間がない」と言わないのか? ~元エンジニアPdMが実践する「ドキュメント化 x MCP」の全貌~
sam8helloworld
0
150
Dayz株式会社 / 会社案内
dayzjp
PRO
0
220
「要はバランス」を見極める - ADR実践で目指す技術的卓越への道 / It Depends: Practicing ADRs Toward Technical Excellence
ewa
0
850
採用向け会社紹介資料_20260105.pdf
yoshikatsu0423
0
140
株式会社夜明け会社概要資料2025.ver
tomoyuki1188
PRO
0
270
アシスト 会社紹介資料
ashisuto_career
3
150k
TORICO Ethereum_companydeck_20251217
torico
0
1.9k
株式会社レコモット会社紹介資料
recomothr
0
12k
組織としてのプロダクトマネジメント力を高める〜Sansanの実践と課題〜
sansantech
PRO
3
140
『業務設計の教科書』の概要
shunsuke_takeuchi
PRO
4
9k
Featured
See All Featured
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.1k
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
250
Writing Fast Ruby
sferik
630
62k
Raft: Consensus for Rubyists
vanstee
141
7.3k
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
100
Heart Work Chapter 1 - Part 1
lfama
PRO
4
35k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
1
220
Thoughts on Productivity
jonyablonski
73
5k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.8k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
Transcript
パターンを 極めて文 を 操ろう! Presented by wakcy
自己紹介 Friends Name: Wacky(ワッキー) UiPath 歴: 4年半 RPA/UiPathFriendsとの関わり: UiPathサービスパートナー企業にて開発を始め、 プリセールス、プロジェクトマネージメントを経て、
現在、転職先にて社内の業務自動化の推進・運営に携わっております。 趣味:湯活・サ活 Twitter: @W_Wacky20
ライブコーディングのお題: PDFのデータ抽出をしてみよう! 需要③:電帳法の改正 でPDFのデータ抽出作 業増えた 需要①: PDFは便利だ から。使用するお客さん 多い 需要②:内の業界は
Word/PDF文化なんだ よね
PDFの文字データを構造的なデータに… こんな風なお悩みありませんか? ・実現可否判断はスキャンデータ以外はどこで判断するの? ・会社のセキュリティー上、AIやCV,DUは使えない… ・正規表現や難しい関数使わなくちゃだめ? そもそも、文字の羅 列ばかり… ぐぬぬっ… 大丈夫! 厚切りなWacky
です! ドキュメントには、 Uh‐huh!! Patternがあるね!
目的と安心ポイント ・成るべくStudioのみ使って行います ・易しめのVB関数やLinqを使用します ・正規表現の多用は控えます ・お時間の関係で、まずはデータ抽出だけにフォーカスを当て ます 【目的】 今後PDFからデータ抽出の実現可否検証で役立ててください 【安心ポイント】
自動化シナリオ 法人登記簿(見本)から下記抽出対象データを取得しExcel にまとめる 【抽出対象】 商号・本店・会社法人等番号と代表者の住所・氏名
まとめ ・必要なデータへたどり着く最短ルートは不用な文字や文章はバッサ リ切り捨てましょう ・不変文字情報の特徴を起点に文字の区切り位置、データの区切 り位置を見極めましょう ・自身が分かりやすい目印などを入れてデータを区切りましょう