Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DMSCube_DataSpiderの見逃しがちな便利機能(データチェック処理編)
Search
吉田彰宏
August 27, 2024
Technology
1
520
DMSCube_DataSpiderの見逃しがちな便利機能(データチェック処理編)
2024年8月27日に開催された【DataSpiderの見逃しがちな便利機能について語ろう!】で画面投影した資料となります。
https://dmscube.com/view/event/13377
吉田彰宏
August 27, 2024
Tweet
Share
More Decks by 吉田彰宏
See All by 吉田彰宏
DMSCube祭り2024_パネルディスカッション
ayoshida
0
220
DMSCube_LT_初心者だった頃の自分に教えてあげたいこと_その2.pdf
ayoshida
0
780
DMSCube_LT_初心者だった頃の自分に教えてあげたいこと.pdf
ayoshida
0
200
DMSCube_LT_DataSpider_気を付けろ_クラウド版はオンプレ版とここが違う_.pdf
ayoshida
0
110
Other Decks in Technology
See All in Technology
エンジニアリングマネージャーの仕事
yuheinakasaka
0
120
AWS Systems Managerのハイブリッドアクティベーションを使用したガバメントクラウド環境の統合管理
toru_kubota
0
100
ABEMAのバグバウンティの取り組み
kurochan
1
150
Phase03_ドキュメント管理
overflowinc
0
890
「通るまでRe-run」から卒業!落ちないテストを書く勘所
asumikam
2
440
Phase08_クイックウィン実装
overflowinc
0
590
スケールアップ企業でQA組織が機能し続けるための組織設計と仕組み〜ボトムアップとトップダウンを両輪としたアプローチ〜
tarappo
3
300
会社紹介資料 / Sansan Company Profile
sansan33
PRO
16
410k
Astro Islandsの 内部実装を 「日本で一番わかりやすく」 ざっくり解説!
knj
0
110
AWS CDK「読めるけど書けない」を脱却するファーストステップ
smt7174
3
210
スピンアウト講座04_ルーティン処理
overflowinc
0
400
俺の/私の最強アーキテクチャ決定戦開催 ― チームで新しいアーキテクチャに適合していくために / 20260322 Naoki Takahashi
shift_evolve
PRO
1
370
Featured
See All Featured
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.3k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
150
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
150
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.3k
Prompt Engineering for Job Search
mfonobong
0
210
Imperfection Machines: The Place of Print at Facebook
scottboms
269
14k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Side Projects
sachag
455
43k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
790
How to Ace a Technical Interview
jacobian
281
24k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
160
Transcript
2024年 8月27日 株式会社テトラ・コミュニケーションズ DataSpiderの見逃しがちな便利機能 (データチェック処理編)
名前: 吉田 彰宏 現職: 株式会社テトラ・コミュニケーションズ 生命保険会社に特化した業務&システムコンサルティング及び システムの開発・構築・運用・保守 DataSpider歴: 2009年~現在 オンプレ版を利用することが多く、クラウド版の利用は少々。
最近、DataSpiderを購入しているがほとんど使っていなかった お客様に対し、活用をしていただけるよう取り組み中。 いよいよ本格的にAWSを学ぶことになりそうです。
こんな経験はありませんか?
DataSpiderでデータ連携の自動化を実現! これで業務を効率化できた。やったー!
ところが、、、連携処理でエラーが発生!! 原因を調べてみると、入力データが想定と違って いたらしい。それなら正しいデータだけ処理する ように改修しよう。
実現はできたけど、簡単なチェック処理をいれたい だけなのに処理が複雑に。 もっと簡単に実現できないのだろうか?
そのような時は データチェック処理 が おすすめです!!
データチェック処理ではこんなことができます。 ・必須チェック ・型チェック ・最小/最大チェック ・正規表現によるチェック ・オプション(全角数値を許容、日付のフォーマット指定など)
利用イメージ [入力元]-[Mapper]-[出力先]という基本構成の内、 [入力元]と[Mapper]の間に使用するケースが多い(気がします)
実際の利用例をサンプルで見ていきましょう!
サンプル1(1/4) その前に、データチェックツールを使わない場合の例です。 CSVの第1項目のバイト数をチェックし、8バイト以下の場合はOK ファイル、8バイトを超えるものはNGファイルへ出し分けます。
サンプル1(2/4) ・CSVの項目をそのままマッピングします。 ・第1項目のバイト数を取得します。
サンプル1(3/4) ・CSVの項目をそのままマッピングします。 ・第6項目が8以下のレコードを処理。
サンプル1(4/4) レコードが振り分けられたCSVが期待通りに作成されました!
サンプル2-1(1/3) データチェックツールを使った例です。 同じようにCSVの第1項目のバイト数をチェックし、結果毎にCSV ファイルへ出し分けます。
サンプル2-1(2/3)
サンプル2-1(3/3) 設定値は3パターンあります
サンプル2-2(1/2) 出力レコードに【すべてのレコードとチェック結果を出力する】 を使った例です。
サンプル2-2(2/2) 【データチェッすべてのレコードとチェック結果を出力する】を 選択すると最終列のチェック結果が追加されるので、それを元に 判断します。
サンプル3(1/6) DMS Cubeの教えて広場への投稿にこのような質問がありました。 レコードに含まれる複数項目のいずれかに値があれば 更新対象とする、ということがやりたいです。(要約版) これをデータチェック処理で実現してみましょう!
サンプル3(2/6) 実現イメージ このようなファイルがあった場合、 9行目(A8の行)以外を処理したい。
サンプル3(3/6) 処理フローはこれまでのサンプルと同じ構成となります。
サンプル3(4/6) これで3~5列目のいずれかに値が入っていれば処理される!
サンプル3(6/6) 期待した通りのCSVが作成されました!
データチェック処理は大きく次の2つの使い方があります。 ① 正常なデータとエラーデータを分ける ② 正常なデータの中から処理対象のデータだけを抽出する まとめ
DataSpiderには日々の業務に有用な機能が色々用意されています。 しかし、普段利用せず、知らないままとなっている機能や使い方も まだまだたくさんあります。 もし、「今まで知らなかった!」というものを見つけた時は DMS Cubeに投稿して教えてもらえると嬉しいです。 最後に
ご清聴ありがとうございました。 株式会社テトラ・コミュニケーションズ