ndb

ndb “NDB is a better datastore API for the Google
App Engine Python runtime.”

Part 1 of 2

Why ndb? 1. Less stupid by default 2. More flexible
queries 3. Tasklets with autobatching

Less stupid by default With db: class UserVideo(db.Model): user_id =
db.StringProperty() video = db.ReferenceProperty(Video) user_video = UserVideo.get_for_video_and_user_data( video, user_data) return jsonify(user_video) # slow

Less stupid by default With ndb: class UserVideo(ndb.Model): user_id =
ndb.StringProperty() video = ndb.KeyProperty(kind=Video) user_video = UserVideo.get_for_video_and_user_data( video, user_data) return jsonify(user_video) # not slow!

More flexible queries ndb lets you build filters using ndb.AND
and ndb.OR: questions = Feedback.query() .filter(Feedback.type == 'question') .filter(Feedback.target == video_key) .filter(ndb.OR( Feedback.is_visible_to_public == True, Feedback.author_user_id == current_id)) .fetch(1000) Magic happens.

Performance The datastore is slow. How can we speed things
up? 4 Batch operations together 4 Do things in parallel 4 Avoid the datastore

Tasklets and autobatching def get_user_exercise_cache(user_data): uec = UEC.get_for_user_data(user_data) if not
uec: user_exercises = UE.get_all(user_data) uec = UEC.build(user_exercises) return uec def get_all_uecs(user_datas): return map(get_user_exercise_cache, user_datas)

Tasklets and autobatching @ndb.tasklet def get_user_exercise_cache_async(user_data): uec = yield UEC.get_for_user_data_async(user_data)
if not uec: user_exercises = yield UE.get_all(user_data) uec = UEC.build(user_exercises) raise ndb.Return(uec) @ndb.synctasklet def get_all_uecs(user_datas): uecs = yield map(get_user_exercise_cache_async, user_datas) raise ndb.Return(uecs)

Moral ndb is awesome. Use it.

Part 2 of 2

The sad truth ndb isn't perfect.

Mysterious errors You heard from Marcia about this gem back
in March: TypeError: '_BaseValue' object is not subscriptable

Q: What's worse than code that doesn't work at all?
A: Code that mostly works but breaks in subtle ways.

Secret slowness #1 Multi-queries, with IN and OR: answers =
Feedback.query() .filter(Feedback.type == 'answer') .filter(Feedback.in_reply_to.IN(question_keys)) .fetch(1000) Doesn't run in parallel!

Secret slowness #1 A not-horribly-slow multi-query: answers = Feedback.query() .filter(Feedback.type
== 'answer') .filter(Feedback.in_reply_to.IN(question_keys)) .order(Feedback.__key__) .fetch(1000)

Secret slowness #2 Query iterators: query = Feedback.query().filter( Feedback.topic_ids ==
'algebra') questions = [] for q in query.iter(batch_size=20): if q.is_visible_to(user_data): questions.append(q) if len(questions) >= 10: break

Secret slowness #2 Solution? Sometimes you have to do it
by hand.

Moral ndb isn't perfect. Pay attention. Profile your code.

The End

ndb

ndb

spicyj

More Decks by spicyj

Other Decks in Technology

Featured

Transcript

ndb “NDB is a better datastore API for the Google

Part 1 of 2

Why ndb? 1. Less stupid by default 2. More flexible

Less stupid by default With db: class UserVideo(db.Model): user_id =

Less stupid by default With ndb: class UserVideo(ndb.Model): user_id =

More flexible queries ndb lets you build filters using ndb.AND

Performance The datastore is slow. How can we speed things

Tasklets and autobatching def get_user_exercise_cache(user_data): uec = UEC.get_for_user_data(user_data) if not

Tasklets and autobatching @ndb.tasklet def get_user_exercise_cache_async(user_data): uec = yield UEC.get_for_user_data_async(user_data)

Moral ndb is awesome. Use it.

Part 2 of 2

The sad truth ndb isn't perfect.

Mysterious errors You heard from Marcia about this gem back

Q: What's worse than code that doesn't work at all?

Secret slowness #1 Multi-queries, with IN and OR: answers =

Secret slowness #1 A not-horribly-slow multi-query: answers = Feedback.query() .filter(Feedback.type

Secret slowness #2 Query iterators: query = Feedback.query().filter( Feedback.topic_ids ==

Secret slowness #2 Solution? Sometimes you have to do it

Moral ndb isn't perfect. Pay attention. Profile your code.

The End