Kubernetes Controllers - are they loops or events?

Kubernetes Controllers Are they loops or events? Tim Hockin @thockin
v1

Background on “reconciliation”: https://speakerdeck.com/thockin/kubernetes-what-is-reconciliation

Background on “edge vs. level”: https://speakerdeck.com/thockin/edge-vs-level-triggered-logic

Usually when we talk about controllers we refer to them
as a “loop”

Imagine a controller for Pods (aka kubelet). It has 2
jobs: 1) Actuate the pod API 2) Report status on pods

What you’d expect looks something like:

Node Kubernetes API a kubelet b c Get all pods

Node Kubernetes API a kubelet b c { name: a,
... } { name: b, ... } { name: c, ... }

Node Kubernetes API a kubelet b c for each pod
p { if p is running { verify p config } else { start p } gather status }

Node Kubernetes API a kubelet b c Set status c
a b

...then repeat (aka “a poll loop”)

Here’s where it matters

Node Kubernetes API a kubelet b c c a b
kubectl delete pod b

Node Kubernetes API a kubelet c c a b kubectl
delete pod b

Node Kubernetes API a kubelet c Get all pods c
a b

Node Kubernetes API a kubelet c { name: a, ...
} { name: c, ... } c a b

Node Kubernetes API a kubelet c I have “b” but
API doesn’t - delete it! c a b

Node Kubernetes API a kubelet c Set status c a

This is correct level-triggered reconciliation Read desired state, make it
so

Some controllers are implemented this way, but it’s ineﬃcient at
scale

Imagine thousands of controllers (kubelet, kube-proxy, dns, ingress, storage...) polling
continuously

We need to achieve the same behavior more eﬃciently

We could poll less often, but then it takes a
long (and variable) time to react - not a great UX

Enter the “list-watch” model

Node Kubernetes API a kubelet b c Get all pods

Node Kubernetes API a kubelet b c { name: a,
... } { name: b, ... } { name: c, ... }

Node Kubernetes API a kubelet b c Cache: { name:
a, ... } { name: b, ... } { name: c, ... }

Node Kubernetes API a kubelet b c Watch all pods
Cache: { name: a, ... } { name: b, ... } { name: c, ... }

Node Kubernetes API a kubelet b c Cache: { name:
a, ... } { name: b, ... } { name: c, ... } for each pod p { if p is running { verify p config } else { start p } gather status }

Node Kubernetes API a kubelet b c Set status c
a b Cache: { name: a, ... } { name: b, ... } { name: c, ... }

We trade memory (the cache) for other resources (API server
CPU in particular)

There’s no point in polling my own cache, so what
happens next?

Remember that watch we did earlier? That’s an open stream
for events.

Node Kubernetes API a kubelet b c c a b
kubectl delete pod b Cache: { name: a, ... } { name: b, ... } { name: c, ... }

Node Kubernetes API a kubelet c c a b kubectl
delete pod b Cache: { name: a, ... } { name: b, ... } { name: c, ... }

Node Kubernetes API a kubelet c Delete: { name: b,
... } c a b Cache: { name: a, ... } { name: b, ... } { name: c, ... }

Node Kubernetes API a kubelet c Delete: { name: b,
... } c a b Cache: { name: a, ... } { name: c, ... }

Node Kubernetes API a kubelet c Cache: { name: a,
... } { name: c, ... } c a b API said to delete pod “b”.

Node Kubernetes API a kubelet c Cache: { name: a,
... } { name: c, ... } c a API said to delete pod “b”.

“But you said edge-triggered is bad!”

It is! But this isn’t edge-triggered.

The cache is updated by events (edges) but we are
still reconciling state

“???”

The controller can be restarted at any time and the
cache will be reconstructed - we can’t “miss an edge*” * modulo bugs, read on

Even if you miss an event, you can still recover
the state

Ultimately it’s all just software, and software has bugs. Controllers
should re-list periodically to get full state...

...but we’ve put a lot of energy into making sure
that our list-watch is reliable.

Kubernetes Controllers - are they loops or events?

Kubernetes Controllers - are they loops or events?

More Decks by Tim Hockin

Other Decks in Technology

Featured

Transcript