Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DMSCube_DataSpiderの見逃しがちな便利機能(データチェック処理編)
Search
吉田彰宏
August 27, 2024
Technology
1
440
DMSCube_DataSpiderの見逃しがちな便利機能(データチェック処理編)
2024年8月27日に開催された【DataSpiderの見逃しがちな便利機能について語ろう!】で画面投影した資料となります。
https://dmscube.com/view/event/13377
吉田彰宏
August 27, 2024
Tweet
Share
More Decks by 吉田彰宏
See All by 吉田彰宏
DMSCube祭り2024_パネルディスカッション
ayoshida
0
210
DMSCube_LT_初心者だった頃の自分に教えてあげたいこと_その2.pdf
ayoshida
0
740
DMSCube_LT_初心者だった頃の自分に教えてあげたいこと.pdf
ayoshida
0
190
DMSCube_LT_DataSpider_気を付けろ_クラウド版はオンプレ版とここが違う_.pdf
ayoshida
0
110
Other Decks in Technology
See All in Technology
Connection-based OAuthから学ぶOAuth for AI Agents
flatt_security
0
250
[Data & AI Summit '25 Fall] AIでデータ活用を進化させる!Google Cloudで作るデータ活用の未来
kirimaru
0
150
モダンデータスタックの理想と現実の間で~1.3億人Vポイントデータ基盤の現在地とこれから~
taromatsui_cccmkhd
1
220
ESXi のAIOps だ!2025冬
unnowataru
0
170
mairuでつくるクレデンシャルレス開発環境 / Credential-less development environment using Mailru
mirakui
5
580
AgentCore BrowserとClaude Codeスキルを活用した 『初手AI』を実現する業務自動化AIエージェント基盤
ruzia
7
810
Fashion×AI「似合う」を届けるためのWEARのAI戦略
zozotech
PRO
2
1.1k
Entity Framework Core におけるIN句クエリ最適化について
htkym
0
100
接客歴・営業歴の方が長いエンジニアから見たre:Invent2025
yama3133
0
100
S3を正しく理解するための内部構造の読解
nrinetcom
PRO
3
230
Agent Skillsがハーネスの垣根を超える日
gotalab555
5
3k
ExpoのインダストリーブースでみたAWSが見せる製造業の未来
hamadakoji
0
180
Featured
See All Featured
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
How to Talk to Developers About Accessibility
jct
1
83
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
100
Thoughts on Productivity
jonyablonski
73
5k
Navigating Team Friction
lara
191
16k
Getting science done with accelerated Python computing platforms
jacobtomlinson
0
75
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Designing Powerful Visuals for Engaging Learning
tmiket
0
180
Discover your Explorer Soul
emna__ayadi
2
1k
Why Our Code Smells
bkeepers
PRO
340
57k
Ruling the World: When Life Gets Gamed
codingconduct
0
93
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
23
Transcript
2024年 8月27日 株式会社テトラ・コミュニケーションズ DataSpiderの見逃しがちな便利機能 (データチェック処理編)
名前: 吉田 彰宏 現職: 株式会社テトラ・コミュニケーションズ 生命保険会社に特化した業務&システムコンサルティング及び システムの開発・構築・運用・保守 DataSpider歴: 2009年~現在 オンプレ版を利用することが多く、クラウド版の利用は少々。
最近、DataSpiderを購入しているがほとんど使っていなかった お客様に対し、活用をしていただけるよう取り組み中。 いよいよ本格的にAWSを学ぶことになりそうです。
こんな経験はありませんか?
DataSpiderでデータ連携の自動化を実現! これで業務を効率化できた。やったー!
ところが、、、連携処理でエラーが発生!! 原因を調べてみると、入力データが想定と違って いたらしい。それなら正しいデータだけ処理する ように改修しよう。
実現はできたけど、簡単なチェック処理をいれたい だけなのに処理が複雑に。 もっと簡単に実現できないのだろうか?
そのような時は データチェック処理 が おすすめです!!
データチェック処理ではこんなことができます。 ・必須チェック ・型チェック ・最小/最大チェック ・正規表現によるチェック ・オプション(全角数値を許容、日付のフォーマット指定など)
利用イメージ [入力元]-[Mapper]-[出力先]という基本構成の内、 [入力元]と[Mapper]の間に使用するケースが多い(気がします)
実際の利用例をサンプルで見ていきましょう!
サンプル1(1/4) その前に、データチェックツールを使わない場合の例です。 CSVの第1項目のバイト数をチェックし、8バイト以下の場合はOK ファイル、8バイトを超えるものはNGファイルへ出し分けます。
サンプル1(2/4) ・CSVの項目をそのままマッピングします。 ・第1項目のバイト数を取得します。
サンプル1(3/4) ・CSVの項目をそのままマッピングします。 ・第6項目が8以下のレコードを処理。
サンプル1(4/4) レコードが振り分けられたCSVが期待通りに作成されました!
サンプル2-1(1/3) データチェックツールを使った例です。 同じようにCSVの第1項目のバイト数をチェックし、結果毎にCSV ファイルへ出し分けます。
サンプル2-1(2/3)
サンプル2-1(3/3) 設定値は3パターンあります
サンプル2-2(1/2) 出力レコードに【すべてのレコードとチェック結果を出力する】 を使った例です。
サンプル2-2(2/2) 【データチェッすべてのレコードとチェック結果を出力する】を 選択すると最終列のチェック結果が追加されるので、それを元に 判断します。
サンプル3(1/6) DMS Cubeの教えて広場への投稿にこのような質問がありました。 レコードに含まれる複数項目のいずれかに値があれば 更新対象とする、ということがやりたいです。(要約版) これをデータチェック処理で実現してみましょう!
サンプル3(2/6) 実現イメージ このようなファイルがあった場合、 9行目(A8の行)以外を処理したい。
サンプル3(3/6) 処理フローはこれまでのサンプルと同じ構成となります。
サンプル3(4/6) これで3~5列目のいずれかに値が入っていれば処理される!
サンプル3(6/6) 期待した通りのCSVが作成されました!
データチェック処理は大きく次の2つの使い方があります。 ① 正常なデータとエラーデータを分ける ② 正常なデータの中から処理対象のデータだけを抽出する まとめ
DataSpiderには日々の業務に有用な機能が色々用意されています。 しかし、普段利用せず、知らないままとなっている機能や使い方も まだまだたくさんあります。 もし、「今まで知らなかった!」というものを見つけた時は DMS Cubeに投稿して教えてもらえると嬉しいです。 最後に
ご清聴ありがとうございました。 株式会社テトラ・コミュニケーションズ