Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
パターンを見極めて文字を操ろう!
Search
UiPath Friends
May 23, 2023
Business
0
140
パターンを見極めて文字を操ろう!
UiPath Friends
May 23, 2023
Tweet
Share
More Decks by UiPath Friends
See All by UiPath Friends
Orchestrator Manager使ってみた
uipathfriends
0
390
市民開発&社内コミュニティ推進トーク
uipathfriends
0
230
グローバルハッカソン体験談
uipathfriends
0
77
UiPathの副業市場
uipathfriends
0
100
UiPathは世界を笑顔にする
uipathfriends
0
64
Autopilotやってみた
uipathfriends
0
790
AI at Workが切り拓くオートメーションの未来とカスタマーストーリー
uipathfriends
0
79
UiPathの教育的効果の再考_がっきー
uipathfriends
0
49
IT未経験からITエンジニアへ_田口凌雅
uipathfriends
0
120
Other Decks in Business
See All in Business
ユウミ会社説明資料
yumi2023
0
400
Sales Marker Culture book
salesmarker
PRO
35
56k
株式会社クラダシ_中期経営計画(2025年6月期‐2027年6月期)
kuradashi
0
150
Gemini CLI ハンズアウト
mickey_kubo
2
190
VISASQ: ABOUT DEV TEAM
eikohashiba
4
30k
20250613_CMC_2025_A3
hideki_ojima
0
460
社会の中のわたしの技術 ─ 自分の地図の描き方 #wttjp
yotii23
0
210
第9回 情シス転職ミートアップ - わたしのミッションとLayerXに決めた理由
shimosyan
0
290
組織を AI との協働に最適化する ~ AI と人が補完しあって成長し続ける組織の作り方 ~
yoshizaki
0
460
採用ピッチデック
macloud
3
75k
Ускорение создания стратегии с помощью ИИ
alexanderbyndyu
0
630
フルカイテン株式会社 採用資料
fullkaiten
0
66k
Featured
See All Featured
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
124
52k
BBQ
matthewcrist
89
9.7k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
181
53k
Statistics for Hackers
jakevdp
799
220k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
2.9k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
20k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
How STYLIGHT went responsive
nonsquared
100
5.6k
Bash Introduction
62gerente
614
210k
Visualization
eitanlees
146
16k
The Art of Programming - Codeland 2020
erikaheidi
54
13k
Transcript
パターンを 極めて文 を 操ろう! Presented by wakcy
自己紹介 Friends Name: Wacky(ワッキー) UiPath 歴: 4年半 RPA/UiPathFriendsとの関わり: UiPathサービスパートナー企業にて開発を始め、 プリセールス、プロジェクトマネージメントを経て、
現在、転職先にて社内の業務自動化の推進・運営に携わっております。 趣味:湯活・サ活 Twitter: @W_Wacky20
ライブコーディングのお題: PDFのデータ抽出をしてみよう! 需要③:電帳法の改正 でPDFのデータ抽出作 業増えた 需要①: PDFは便利だ から。使用するお客さん 多い 需要②:内の業界は
Word/PDF文化なんだ よね
PDFの文字データを構造的なデータに… こんな風なお悩みありませんか? ・実現可否判断はスキャンデータ以外はどこで判断するの? ・会社のセキュリティー上、AIやCV,DUは使えない… ・正規表現や難しい関数使わなくちゃだめ? そもそも、文字の羅 列ばかり… ぐぬぬっ… 大丈夫! 厚切りなWacky
です! ドキュメントには、 Uh‐huh!! Patternがあるね!
目的と安心ポイント ・成るべくStudioのみ使って行います ・易しめのVB関数やLinqを使用します ・正規表現の多用は控えます ・お時間の関係で、まずはデータ抽出だけにフォーカスを当て ます 【目的】 今後PDFからデータ抽出の実現可否検証で役立ててください 【安心ポイント】
自動化シナリオ 法人登記簿(見本)から下記抽出対象データを取得しExcel にまとめる 【抽出対象】 商号・本店・会社法人等番号と代表者の住所・氏名
まとめ ・必要なデータへたどり着く最短ルートは不用な文字や文章はバッサ リ切り捨てましょう ・不変文字情報の特徴を起点に文字の区切り位置、データの区切 り位置を見極めましょう ・自身が分かりやすい目印などを入れてデータを区切りましょう