Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DMSCube_DataSpiderの見逃しがちな便利機能(データチェック処理編)
Search
吉田彰宏
August 27, 2024
Technology
1
480
DMSCube_DataSpiderの見逃しがちな便利機能(データチェック処理編)
2024年8月27日に開催された【DataSpiderの見逃しがちな便利機能について語ろう!】で画面投影した資料となります。
https://dmscube.com/view/event/13377
吉田彰宏
August 27, 2024
Tweet
Share
More Decks by 吉田彰宏
See All by 吉田彰宏
DMSCube祭り2024_パネルディスカッション
ayoshida
0
220
DMSCube_LT_初心者だった頃の自分に教えてあげたいこと_その2.pdf
ayoshida
0
770
DMSCube_LT_初心者だった頃の自分に教えてあげたいこと.pdf
ayoshida
0
200
DMSCube_LT_DataSpider_気を付けろ_クラウド版はオンプレ版とここが違う_.pdf
ayoshida
0
110
Other Decks in Technology
See All in Technology
OCI Database Management サービス詳細
oracle4engineer
PRO
1
7.4k
ランサムウェア対策としてのpnpm導入のススメ
ishikawa_satoru
0
230
こんなところでも(地味に)活躍するImage Modeさんを知ってるかい?- Image Mode for OpenShift -
tsukaman
1
170
Claude Code for NOT Programming
kawaguti
PRO
1
110
StrandsとNeptuneを使ってナレッジグラフを構築する
yakumo
1
130
猫でもわかるKiro CLI(セキュリティ編)
kentapapa
0
120
学生・新卒・ジュニアから目指すSRE
hiroyaonoe
2
770
【Oracle Cloud ウェビナー】[Oracle AI Database + AWS] Oracle Database@AWSで広がるクラウドの新たな選択肢とAI時代のデータ戦略
oracle4engineer
PRO
2
190
AzureでのIaC - Bicep? Terraform? それ早く言ってよ会議
torumakabe
1
620
Claude_CodeでSEOを最適化する_AI_Ops_Community_Vol.2__マーケティングx_AIはここまで進化した.pdf
riku_423
2
610
制約が導く迷わない設計 〜 信頼性と運用性を両立するマイナンバー管理システムの実践 〜
bwkw
3
1.1k
ECS障害を例に学ぶ、インシデント対応に備えたAIエージェントの育て方 / How to develop AI agents for incident response with ECS outage
iselegant
4
430
Featured
See All Featured
Six Lessons from altMBA
skipperchong
29
4.2k
The Curious Case for Waylosing
cassininazir
0
240
AI: The stuff that nobody shows you
jnunemaker
PRO
2
280
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.7k
GitHub's CSS Performance
jonrohan
1032
470k
Navigating Weather and Climate Data
rabernat
0
110
Visualization
eitanlees
150
17k
First, design no harm
axbom
PRO
2
1.1k
Building the Perfect Custom Keyboard
takai
2
690
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
200
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
Google's AI Overviews - The New Search
badams
0
910
Transcript
2024年 8月27日 株式会社テトラ・コミュニケーションズ DataSpiderの見逃しがちな便利機能 (データチェック処理編)
名前: 吉田 彰宏 現職: 株式会社テトラ・コミュニケーションズ 生命保険会社に特化した業務&システムコンサルティング及び システムの開発・構築・運用・保守 DataSpider歴: 2009年~現在 オンプレ版を利用することが多く、クラウド版の利用は少々。
最近、DataSpiderを購入しているがほとんど使っていなかった お客様に対し、活用をしていただけるよう取り組み中。 いよいよ本格的にAWSを学ぶことになりそうです。
こんな経験はありませんか?
DataSpiderでデータ連携の自動化を実現! これで業務を効率化できた。やったー!
ところが、、、連携処理でエラーが発生!! 原因を調べてみると、入力データが想定と違って いたらしい。それなら正しいデータだけ処理する ように改修しよう。
実現はできたけど、簡単なチェック処理をいれたい だけなのに処理が複雑に。 もっと簡単に実現できないのだろうか?
そのような時は データチェック処理 が おすすめです!!
データチェック処理ではこんなことができます。 ・必須チェック ・型チェック ・最小/最大チェック ・正規表現によるチェック ・オプション(全角数値を許容、日付のフォーマット指定など)
利用イメージ [入力元]-[Mapper]-[出力先]という基本構成の内、 [入力元]と[Mapper]の間に使用するケースが多い(気がします)
実際の利用例をサンプルで見ていきましょう!
サンプル1(1/4) その前に、データチェックツールを使わない場合の例です。 CSVの第1項目のバイト数をチェックし、8バイト以下の場合はOK ファイル、8バイトを超えるものはNGファイルへ出し分けます。
サンプル1(2/4) ・CSVの項目をそのままマッピングします。 ・第1項目のバイト数を取得します。
サンプル1(3/4) ・CSVの項目をそのままマッピングします。 ・第6項目が8以下のレコードを処理。
サンプル1(4/4) レコードが振り分けられたCSVが期待通りに作成されました!
サンプル2-1(1/3) データチェックツールを使った例です。 同じようにCSVの第1項目のバイト数をチェックし、結果毎にCSV ファイルへ出し分けます。
サンプル2-1(2/3)
サンプル2-1(3/3) 設定値は3パターンあります
サンプル2-2(1/2) 出力レコードに【すべてのレコードとチェック結果を出力する】 を使った例です。
サンプル2-2(2/2) 【データチェッすべてのレコードとチェック結果を出力する】を 選択すると最終列のチェック結果が追加されるので、それを元に 判断します。
サンプル3(1/6) DMS Cubeの教えて広場への投稿にこのような質問がありました。 レコードに含まれる複数項目のいずれかに値があれば 更新対象とする、ということがやりたいです。(要約版) これをデータチェック処理で実現してみましょう!
サンプル3(2/6) 実現イメージ このようなファイルがあった場合、 9行目(A8の行)以外を処理したい。
サンプル3(3/6) 処理フローはこれまでのサンプルと同じ構成となります。
サンプル3(4/6) これで3~5列目のいずれかに値が入っていれば処理される!
サンプル3(6/6) 期待した通りのCSVが作成されました!
データチェック処理は大きく次の2つの使い方があります。 ① 正常なデータとエラーデータを分ける ② 正常なデータの中から処理対象のデータだけを抽出する まとめ
DataSpiderには日々の業務に有用な機能が色々用意されています。 しかし、普段利用せず、知らないままとなっている機能や使い方も まだまだたくさんあります。 もし、「今まで知らなかった!」というものを見つけた時は DMS Cubeに投稿して教えてもらえると嬉しいです。 最後に
ご清聴ありがとうございました。 株式会社テトラ・コミュニケーションズ