20250829_LambdaとStepFunctionsどちらを選ぶべき_コスト視点で考えてみる.pdf

Slide 1

Slide 1 text

Lambda と Step Functions どちらを選ぶべき？コスト視点で考えてみる JAWS-UG名古屋 2025年8月29日（金）

Slide 12

Slide 12 text

import json import boto3 import logging frombotocore.exceptions import ClientError import itertools logger = logging.getLogger() logger.setLevel(logging.INFO) s3 = boto3.client("s3") dynamodb = boto3.client("dynamodb") TABLE_NAME = "h-test-stepfunctions-table" def lambda_handler(event, context): try: # --- 1. S3イベントからバケット名とキー取得 --- record = event["Records"][0] bucket = record["s3"]["bucket"]["name"] key = record["s3"]["object"]["key"] logger.info(f"Triggered by file: s3://{bucket}/{key}") # --- 2. ファイル取得 --- response = s3.get_object(Bucket=bucket, Key=key) body = response["Body"].read().decode("utf-8") records = json.loads(body) if not isinstance(records, list): raise ValueError("JSON file must contain an array of records") logger.info(f"Parsed {len(records)} records") success_count = 0 failure_count = 0 # --- 3. 100件ずつに分割してトランザクション書き込み --- for batch in chunked(records, 100): transact_items = [] for rec in batch: if "userId" not in rec or "score" not in rec: logger.warning(f"Skipping invalid record: {rec}") failure_count += 1 continue i# 同一トランザクション内に同じUserIdが含まれないように注意 if any(item["Put"]["Item"]["UserId"]["S"] == str(rec["userId"]) for item in transact_items): logger.warning(f"Duplicate userId in same transaction, skipping: {rec['userId']}") failure_count += 1 continue transact_items.append({ "Put": { "TableName": TABLE_NAME, "Item": { "UserId": {"S": str(rec["userId"])}, "Score": {"N": str(rec["score"])}, "Name": {"S": rec.get("name", "N/A")}, "Timestamp": {"S": rec.get("timestamp", "N/A")} }}}) if not transact_items: continue try: dynamodb.transact_write_items(TransactItems=transact_items) success_count += len(transact_items) except ClientError as e: logger.error(f"Transaction failed: {e}") failure_count += len(transact_items) logger.info(f"Inserted: {success_count}, Failed: {failure_count}") return { "statusCode": 200, "body": json.dumps({"inserted": success_count, "failed": failure_count}) } except Exception as e: logger.exception(f"Unhandled error: {e}") return { "statusCode": 500, "body": json.dumps({"error": str(e)}) } def chunked(iterable, n): """リストをn件ごとのサブリストに分割""" it = iter(iterable) while True: batch = list(itertools.islice(it, n)) if not batch: break yield batch DynamoDB S3 Lambdaで実装 • S3にデータファイルを格納 • ファイル格納をトリガーにして、DynamoDBに格納 • データは一意、更新はなし Lambda イベント通知 TransactWriteItems 1.S3イベント通知でLambda起動 2.LambdaがS3からデータ取得 3.データを100件づつに分割 4.TransactWriteItemsで100件づつ書き込み 94Line

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text