Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DMSCube_DataSpiderの見逃しがちな便利機能(データチェック処理編)
Search
吉田彰宏
August 27, 2024
Technology
1
49
DMSCube_DataSpiderの見逃しがちな便利機能(データチェック処理編)
2024年8月27日に開催された【DataSpiderの見逃しがちな便利機能について語ろう!】で画面投影した資料となります。
https://dmscube.com/view/event/13377
吉田彰宏
August 27, 2024
Tweet
Share
More Decks by 吉田彰宏
See All by 吉田彰宏
DMSCube祭り2024_パネルディスカッション
ayoshida
0
120
DMSCube_LT_初心者だった頃の自分に教えてあげたいこと_その2.pdf
ayoshida
0
330
DMSCube_LT_初心者だった頃の自分に教えてあげたいこと.pdf
ayoshida
0
150
DMSCube_LT_DataSpider_気を付けろ_クラウド版はオンプレ版とここが違う_.pdf
ayoshida
0
80
Other Decks in Technology
See All in Technology
KubeVirt Networking ONIC 2024
orimanabu
4
600
スクラム導入の舞台裏:QAエンジニアがスクラムマスターになるまで
bubo1201
0
240
業務ヒアリングと知識の呪い
tamai_63
0
290
Webセキュリティのあるきかた
akiym
32
10k
【shownet.conf_】トポロジ図の歩き方
shownet
PRO
0
530
kube-vipとkube-proxy置き換えCiliumを積んだ究極のK3sクラスタを建てる
logica0419
4
220
Qdrant を用いた検索改善施策の紹介 / Search Engineering Tech Talk 2024 Summer
visional_engineering_and_design
1
190
Castor - Le Task Runner PHP qui simplifie votre Workflow
lyrixx
1
240
リスクから学ぶKubernetesコンテナセキュリティ/k8s-risk-and-security
mochizuki875
1
330
シェルとPerlの使い分け、 そういった思考の道具は、どこから来て、どこへゆくのか?v1.1.0
fmlorg
0
330
入社半年(合計1年)でGoogle Cloud 認定を全冠した秘訣🤫
risatube
1
230
Azure App Service on Linux の Sidecar に Phi-3 を配置してインテリジェントなアプリケーションを作ってみよう/jazug-anniv14
thara0402
0
460
Featured
See All Featured
Design by the Numbers
sachag
278
19k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
27
1.9k
Robots, Beer and Maslow
schacon
PRO
157
8.2k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Rails Girls Zürich Keynote
gr2m
93
13k
Optimizing for Happiness
mojombo
375
69k
10 Git Anti Patterns You Should be Aware of
lemiorhan
653
59k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
246
1.3M
Building a Modern Day E-commerce SEO Strategy
aleyda
38
6.8k
Docker and Python
trallard
40
3k
Unsuck your backbone
ammeep
668
57k
Making the Leap to Tech Lead
cromwellryan
131
8.8k
Transcript
2024年 8月27日 株式会社テトラ・コミュニケーションズ DataSpiderの見逃しがちな便利機能 (データチェック処理編)
名前: 吉田 彰宏 現職: 株式会社テトラ・コミュニケーションズ 生命保険会社に特化した業務&システムコンサルティング及び システムの開発・構築・運用・保守 DataSpider歴: 2009年~現在 オンプレ版を利用することが多く、クラウド版の利用は少々。
最近、DataSpiderを購入しているがほとんど使っていなかった お客様に対し、活用をしていただけるよう取り組み中。 いよいよ本格的にAWSを学ぶことになりそうです。
こんな経験はありませんか?
DataSpiderでデータ連携の自動化を実現! これで業務を効率化できた。やったー!
ところが、、、連携処理でエラーが発生!! 原因を調べてみると、入力データが想定と違って いたらしい。それなら正しいデータだけ処理する ように改修しよう。
実現はできたけど、簡単なチェック処理をいれたい だけなのに処理が複雑に。 もっと簡単に実現できないのだろうか?
そのような時は データチェック処理 が おすすめです!!
データチェック処理ではこんなことができます。 ・必須チェック ・型チェック ・最小/最大チェック ・正規表現によるチェック ・オプション(全角数値を許容、日付のフォーマット指定など)
利用イメージ [入力元]-[Mapper]-[出力先]という基本構成の内、 [入力元]と[Mapper]の間に使用するケースが多い(気がします)
実際の利用例をサンプルで見ていきましょう!
サンプル1(1/4) その前に、データチェックツールを使わない場合の例です。 CSVの第1項目のバイト数をチェックし、8バイト以下の場合はOK ファイル、8バイトを超えるものはNGファイルへ出し分けます。
サンプル1(2/4) ・CSVの項目をそのままマッピングします。 ・第1項目のバイト数を取得します。
サンプル1(3/4) ・CSVの項目をそのままマッピングします。 ・第6項目が8以下のレコードを処理。
サンプル1(4/4) レコードが振り分けられたCSVが期待通りに作成されました!
サンプル2-1(1/3) データチェックツールを使った例です。 同じようにCSVの第1項目のバイト数をチェックし、結果毎にCSV ファイルへ出し分けます。
サンプル2-1(2/3)
サンプル2-1(3/3) 設定値は3パターンあります
サンプル2-2(1/2) 出力レコードに【すべてのレコードとチェック結果を出力する】 を使った例です。
サンプル2-2(2/2) 【データチェッすべてのレコードとチェック結果を出力する】を 選択すると最終列のチェック結果が追加されるので、それを元に 判断します。
サンプル3(1/6) DMS Cubeの教えて広場への投稿にこのような質問がありました。 レコードに含まれる複数項目のいずれかに値があれば 更新対象とする、ということがやりたいです。(要約版) これをデータチェック処理で実現してみましょう!
サンプル3(2/6) 実現イメージ このようなファイルがあった場合、 9行目(A8の行)以外を処理したい。
サンプル3(3/6) 処理フローはこれまでのサンプルと同じ構成となります。
サンプル3(4/6) これで3~5列目のいずれかに値が入っていれば処理される!
サンプル3(6/6) 期待した通りのCSVが作成されました!
データチェック処理は大きく次の2つの使い方があります。 ① 正常なデータとエラーデータを分ける ② 正常なデータの中から処理対象のデータだけを抽出する まとめ
DataSpiderには日々の業務に有用な機能が色々用意されています。 しかし、普段利用せず、知らないままとなっている機能や使い方も まだまだたくさんあります。 もし、「今まで知らなかった!」というものを見つけた時は DMS Cubeに投稿して教えてもらえると嬉しいです。 最後に
ご清聴ありがとうございました。 株式会社テトラ・コミュニケーションズ