Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DMSCube_DataSpiderの見逃しがちな便利機能(データチェック処理編)
Search
吉田彰宏
August 27, 2024
Technology
1
370
DMSCube_DataSpiderの見逃しがちな便利機能(データチェック処理編)
2024年8月27日に開催された【DataSpiderの見逃しがちな便利機能について語ろう!】で画面投影した資料となります。
https://dmscube.com/view/event/13377
吉田彰宏
August 27, 2024
Tweet
Share
More Decks by 吉田彰宏
See All by 吉田彰宏
DMSCube祭り2024_パネルディスカッション
ayoshida
0
200
DMSCube_LT_初心者だった頃の自分に教えてあげたいこと_その2.pdf
ayoshida
0
670
DMSCube_LT_初心者だった頃の自分に教えてあげたいこと.pdf
ayoshida
0
190
DMSCube_LT_DataSpider_気を付けろ_クラウド版はオンプレ版とここが違う_.pdf
ayoshida
0
110
Other Decks in Technology
See All in Technology
Function calling機能をPLaMo2に実装するには / PFN LLMセミナー
pfn
PRO
0
840
"複雑なデータ処理 × 静的サイト" を両立させる、楽をするRails運用 / A low-effort Rails workflow that combines “Complex Data Processing × Static Sites”
hogelog
3
1.7k
about #74462 go/token#FileSet
tomtwinkle
1
280
多野優介
tanoyusuke
1
200
OCI Network Firewall 概要
oracle4engineer
PRO
1
7.8k
ユニットテストに対する考え方の変遷 / Everyone should watch his live coding
mdstoy
0
120
BirdCLEF+2025 Noir 5位解法紹介
myso
0
190
C# 14 / .NET 10 の新機能 (RC 1 時点)
nenonaninu
1
1.5k
Modern_Data_Stack最新動向クイズ_買収_AI_激動の2025年_.pdf
sagara
0
190
関係性が駆動するアジャイル──GPTに人格を与えたら、対話を通してふりかえりを習慣化できた話
mhlyc
0
130
後進育成のしくじり〜任せるスキルとリーダーシップの両立〜
matsu0228
5
1.8k
SwiftUIのGeometryReaderとScrollViewを基礎から応用まで学び直す:設計と活用事例
fumiyasac0921
0
130
Featured
See All Featured
Typedesign – Prime Four
hannesfritz
42
2.8k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
610
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
30
2.9k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
188
55k
Bash Introduction
62gerente
615
210k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Designing Experiences People Love
moore
142
24k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
2.6k
Rails Girls Zürich Keynote
gr2m
95
14k
GraphQLとの向き合い方2022年版
quramy
49
14k
Transcript
2024年 8月27日 株式会社テトラ・コミュニケーションズ DataSpiderの見逃しがちな便利機能 (データチェック処理編)
名前: 吉田 彰宏 現職: 株式会社テトラ・コミュニケーションズ 生命保険会社に特化した業務&システムコンサルティング及び システムの開発・構築・運用・保守 DataSpider歴: 2009年~現在 オンプレ版を利用することが多く、クラウド版の利用は少々。
最近、DataSpiderを購入しているがほとんど使っていなかった お客様に対し、活用をしていただけるよう取り組み中。 いよいよ本格的にAWSを学ぶことになりそうです。
こんな経験はありませんか?
DataSpiderでデータ連携の自動化を実現! これで業務を効率化できた。やったー!
ところが、、、連携処理でエラーが発生!! 原因を調べてみると、入力データが想定と違って いたらしい。それなら正しいデータだけ処理する ように改修しよう。
実現はできたけど、簡単なチェック処理をいれたい だけなのに処理が複雑に。 もっと簡単に実現できないのだろうか?
そのような時は データチェック処理 が おすすめです!!
データチェック処理ではこんなことができます。 ・必須チェック ・型チェック ・最小/最大チェック ・正規表現によるチェック ・オプション(全角数値を許容、日付のフォーマット指定など)
利用イメージ [入力元]-[Mapper]-[出力先]という基本構成の内、 [入力元]と[Mapper]の間に使用するケースが多い(気がします)
実際の利用例をサンプルで見ていきましょう!
サンプル1(1/4) その前に、データチェックツールを使わない場合の例です。 CSVの第1項目のバイト数をチェックし、8バイト以下の場合はOK ファイル、8バイトを超えるものはNGファイルへ出し分けます。
サンプル1(2/4) ・CSVの項目をそのままマッピングします。 ・第1項目のバイト数を取得します。
サンプル1(3/4) ・CSVの項目をそのままマッピングします。 ・第6項目が8以下のレコードを処理。
サンプル1(4/4) レコードが振り分けられたCSVが期待通りに作成されました!
サンプル2-1(1/3) データチェックツールを使った例です。 同じようにCSVの第1項目のバイト数をチェックし、結果毎にCSV ファイルへ出し分けます。
サンプル2-1(2/3)
サンプル2-1(3/3) 設定値は3パターンあります
サンプル2-2(1/2) 出力レコードに【すべてのレコードとチェック結果を出力する】 を使った例です。
サンプル2-2(2/2) 【データチェッすべてのレコードとチェック結果を出力する】を 選択すると最終列のチェック結果が追加されるので、それを元に 判断します。
サンプル3(1/6) DMS Cubeの教えて広場への投稿にこのような質問がありました。 レコードに含まれる複数項目のいずれかに値があれば 更新対象とする、ということがやりたいです。(要約版) これをデータチェック処理で実現してみましょう!
サンプル3(2/6) 実現イメージ このようなファイルがあった場合、 9行目(A8の行)以外を処理したい。
サンプル3(3/6) 処理フローはこれまでのサンプルと同じ構成となります。
サンプル3(4/6) これで3~5列目のいずれかに値が入っていれば処理される!
サンプル3(6/6) 期待した通りのCSVが作成されました!
データチェック処理は大きく次の2つの使い方があります。 ① 正常なデータとエラーデータを分ける ② 正常なデータの中から処理対象のデータだけを抽出する まとめ
DataSpiderには日々の業務に有用な機能が色々用意されています。 しかし、普段利用せず、知らないままとなっている機能や使い方も まだまだたくさんあります。 もし、「今まで知らなかった!」というものを見つけた時は DMS Cubeに投稿して教えてもらえると嬉しいです。 最後に
ご清聴ありがとうございました。 株式会社テトラ・コミュニケーションズ