Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Diferenciabilidade e condicionamento

Diferenciabilidade e condicionamento

Veja esta apresentação em www.bordoni.info.

Paulo Bordoni

October 05, 2016
Tweet

More Decks by Paulo Bordoni

Other Decks in Education

Transcript

  1. Agora nosso passeio pela famosíssima briga entre Leibnitz e Newton

    pela paternidade do Cálculo Diferencial e Integral.
  2. 0 = (0 ) f Esta função é contínua, mas

    não é derivável em 0 . Veja o biquinho pontudo que ela faz em 0 , Loirinha. Derivável ou não, eis a questão!
  3. Dizem que Leibnitz pensava na derivada de uma forma mais

    geométrica que o Newton, que falava em fluxões. Sim Loirinha. Newton pensava mais fisicamente nas coisas. Pensava em fluxos, velocidades e acelerações.
  4. Minha metade platônica concorda com o aspecto geométrico, entretanto afirmo:

    “é fundamental formalizar essa ideia” Minha metade aristotélica diz: “o gráfico da função perdeu a suavidade no ponto 0 ”
  5. Uma contradição apenas aparente. Alguns matemáticos dizem que Cálculo Numérico

    é um sinônimo de “hard analysis” Acredite se quiser, Loirinha! Um bom Cálculo Numérico exige conhecimentos mais profundos de alguns aspectos teóricos da matemática do contínuo.
  6. t = () t b a Assuma que uma grandeza

    é descrita por uma função contínua e suave : , → ℝ, ↦ = (), como na figura:
  7. t = () t b a Para concretizar, assuma que

    t é tempo e y posição. Então ↦ = () descreve como varia a posição de um ponto (um carro) sobre o eixo-y (uma estrada) em função do tempo. tempo posição
  8. t 0 1 1 0 Assuma que no instante 0

    a posição do carro era 0 e que no instante 1 é 1 .
  9. t 0 1 1 0 As variações foram: ∆ =

    1 − 0 e ∆ = 1 − 0 . ∆ ∆ O quociente Τ ∆ ∆ é a taxa de variação da quantidade g.
  10. Como ∆ = 1 − 0 é uma variação temporal

    e ∆ = 1 − 0 uma variação posicional, a taxa de variação Τ ∆ ∆ mede a velocidade média do carro ao se deslocar de 0 para 1 . t 0 1 1 ∆ ∆ 0
  11. t 0 1 1 0 Prestem atenção na reta secante

    (azul) por (0 , 0 ) e (1 , 1 ). Quando 1 → 0 teremos 1 → 0 e, como assumimos que a curva é suave, a reta passa de secante à tangente (vermelha) por (0 , 0 ).
  12. Valeu Mestre. Então quando ∆ = 0, o quociente Τ

    ∆ ∆ será a velocidade instantânea na posição 0 . A ideia de Newton! Surfista, você não pode dividir por zero. Além disso teremos também 1 = 0 de forma que o quociente Τ ∆ ∆ ficará indeterminado!
  13. t 0 1 1 0 Brilhante, Loirinha. Este é mais

    um exemplo da inteligência feminina em ação!
  14. E o que são esses fluxions? As velocidades de incrementos

    evanescentes? E o que são esses mesmos incrementos evanescentes? Eles não são, nem Quantidades finitas, nem Quantidades infinitamente pequenas, não são nada. Não poderíamos chamá-las de fantasmas de quantidades mortas?
  15. t 0 1 1 ∆ ∆ 0 Observem que no

    triângulo rosa Τ ∆ ∆ = , onde é o ângulo do vértice (0 , 0 ). A inclinação da reta secante. Repetindo: A inclinação da reta secante dá a velocidade média!
  16. t 0 1 1 0 Quando ∆ → 0 perdemos

    o triângulo. Mas, se a curva é suave, a reta secante transforma-se na reta tangente.
  17. t 0 1 1 0 Perdemos o triângulo, porém não

    perdemos o ângulo que mede a inclinação da reta tangente. O valor numérico de dá a velocidade instantânea em 0 . Porque é o limite das velocidades médias.
  18. t 0 1 1 0 Quando esse limite existe, é

    igual a (). E g é derivável em 0 . ∆ A definição de derivada de uma função : (, ) → ℝ, num ponto 0 ∈ , : 0 = lim ∆→0 0 + ∆ − (0 ) ∆ .
  19. Sir Isaac Newton 1642 - 1726 Gottfried Wilhelm Leibnitz 1646

    - 1716 Aleluia! E glória eterna a Newton e Leibnitz no céu das ciências. Hosana nas alturas!
  20. Fui buscá-lo no site: MacTutor History of Mathematics. Surfista, vá

    à aba “Leituras adicionais” no site do Mestre e leia “A history of calculus”, de J. J. O'Connor e E. F. Robertson
  21. Repito uma fala calcada na de Trefethen: “Cálculo Numérico está

    intimamente ligado ao contínuo dos números reais”. Atenção Surfista, na abertura do texto, de história do Cálculo, logo no 2º parágrafo os autores falam de números.
  22. Um verdadeiro porco-espinho. Vou mostrar um exemplo clássico de uma

    função contínua, com uma infinidade pontos onde não é derivável.
  23. t ℎ1 /3 1 /3 /3 Será uma coleção de

    chapéus de bruxa! Vou usar funções chapéu na construção. O formato dos chapéus será como abaixo: 1. Largura variável L, e altura fixa 1. 2. Abas com largura L/3 e a base do cone também.
  24. 1/3 t 1 ℎ2 1/31 1/32 1 3 = 20

    + 21 chapéus t 1 1 ℎ3 1/33 1/32 1/31 7 = 20 + 21 + 22 chapéus • A 1ª função, ℎ1 : [0,1] → ℝ, será a da figura anterior, com = 1. • Na 2ª, ℎ2 : [0,1] → ℝ, substituímos as abas da 1ª por 2 chapéus de largura /3. • Na 3ª, ℎ3 : [0,1] → ℝ, substituímos as abas dos 2 chapéus acrescentados por 22 chapéus de largura /32. • Assim por diante – construiremos uma chapelaria!
  25. A função que o Galileu prometeu é a chapelaria definida

    para cada ∈ 0,1 por ℎ = lim →∞ ℎ . Chapéus com uma infinidade de tamanhos. A função ℎ: [0,1] → ℝ é contínua. Porém possui uma infinidade de pontos “angulosos”, isto é, não é derivável numa infinidade de pontos de seu domínio.
  26. A derivada da ℎ() é uma função constante por partes.

    ℎ: [0,1] → ℝ possui uma infinidade de pontos de descontinuidade. Mestre, o gráfico de ℎ é uma escadaria muito diferente da escadaria da igreja da Penha. É uma escadaria muito doida!
  27. Achei na Web uma descrição de como sismógrafos registram os

    abalos sísmicos. Muito simples, um exemplo de engenhosidade! !!!
  28. alexandremedeirosfisicaastronomia. blogspot.com.br/2011/11/terremot os-e-ondas-sismicas.html Recortei este trecho do blog só para

    colocar o anzol na sua boca Surfista. Vá ao endereço abaixo ler o resto (e outros artigos).
  29. Em Análise Numérica, não basta saber, como em Cálculo, se

    a função associada a um problema é contínua ou derivável. Precisamos medir o seu comportamento!
  30. Sim, sempre tive alunos bem comportados como você, Loirinha –

    com nota 10. Também já tive alunos mau comportados. Mestra, você dava nota de comportamento aos seus alunos do 1º grau?
  31. A nota de comportamento para problemas (funções) é outra. Uma

    medida de comportamento de uma função é a sua taxa de variação (de crescimento ou decrescimento) em cada ponto. Que papo careta! Problemas não são crianças para receber nota sobre comportamento.
  32. E como se calcula esse número? Essa medida é denominada

    número de condicionamento do problema (função).
  33. Com a derivada (0 ) no ponto 0 da função

    ↦ = (). Ela é o número que mede a taxa de crescimento da função em 0 (ou de decrescimento). 0 (0 ) (0 )
  34. Para a taxa de variação, i. é., tanto de crescimento

    quanto de decrescimento basta considerar o valor absoluto, o módulo da derivada: (0 ) . 0 (0 ) (0 ) 0 (0 ) (0 ) é crescente em 0 é decrescente em 0
  35. 0 (0 ) (0 ) (0 ) 0 (0 )

    Isso mesmo Galileu e quanto mais inclinada a reta tangente, maior é o valor de | 0 |.
  36. Perfeito Surfista. Valores distintos de 0 produzem resultados diferentes (exceto

    quando é linear). Trata-se de uma medida do comportamento local da função.
  37. O número de condicionamento absoluto do problema associado a uma

    função : (, ) → ℝ, num ponto ∈ (, ), é definido por , = .
  38. + ∆ () ∆ ∆ = + ∆ − +

    ∆ Algumas transparências atrás vimos que a derivada é calculada através do limite do quociente de Newton: = lim ∆→0 + ∆ − ∆
  39. Decorre diretamente daí que: , = = lim ∆→0 |

    + ∆ − | | ∆ | . Ou, de forma mais compacta: , = lim ∆→0 | (∆) | | ∆ | .
  40. Mestra trata-se apenas de uma diferença de notação, não? Sim

    minha filha mas destaca que , é o limite do quociente da variação | ∆ | da em pela variação ∆ em . A taxa de variação instantânea da em .
  41. Como , = lim ∆→0 | (∆) |/|∆| para variações

    ∆ pequenas, teremos , ≅ | (∆) |/|∆|. Não percebi a vantagem!
  42. Bem Loirinha, de , ≅ | (∆) |/|∆| segue que

    ∆ ≅ , |∆|. Mestres, continuo perguntando, e daí?
  43. Essa fórmula, ∆ ≅ , |∆|, pode ser verbalizada como:

    “A variação ∆ é proporcional (aproximada/.) à variação |∆| e o fator de proporcionalidade é , ”.
  44. (∆)() ∆ (0 ) 0 , ≅ (∆) |∆| Apontando

    os holofotes para o que importa: Observe o papel desempenhado pela diagonal do retângulo no cálculo de | ∆ | a partir de ∆ .
  45. A regra para estimar (∆) é clara: Construa um retângulo

    com base ∆ e diagonal fazendo um ângulo , com a base. Então (∆) é a medida do outro lado. ∆ , (∆)
  46. Estaremos interessados nas respostas das funções ↦ = à pequenas

    perturbações |∆| na variável . Prevendo o futuro: Nas próximas aulas, nossa atenção estará voltada para a avaliação de funções nos computadores.
  47. Trabalhar em computadores usando a aritmética finita da IEEE 754/2008.

    Nossos números e contas estarão sujeitos à erros da ordem de múltiplos da . Prevendo o futuro: O que o futuro nos reserva, Mestres?
  48. Em vista do que os Mestres acabaram de informar, um

    nome adequado para o retângulo é “retângulo do erro propagado por em ” ∆ , (∆)
  49. Portanto considerando um erro absoluto ℰ () = () em

    então ℰ ( ) ≅ , (). Sim Cabelos de Fogo, essa é a forma de estimar o erro absoluto ℰ ( ) propagado por em .
  50. f f 0 () (0 ) Um problema, associado a

    uma função : → onde , ⊂ ℝ, é bem condicionado num ponto 0 ∈ quando , 0 não é muito grande.
  51. f f 0 () (0 ) Se , 0 não

    é maior que algumas centenas de unidades, como ∆ ≅ , 0 |∆|, o valor de ∆ não será exageradamente maior que o de |∆|. E os retornos ↦ = (), mediados pelo computador, não serão prejudicados.
  52. ∆ , (∆) Trocando em miúdos: quando o retângulo do

    erro propagado por em não é muito alto.
  53. f () Esta é a característica de um problema mau

    condicionado. f 0 (0 ) ∆ ∆ Porém, quando o valor de , 0 é muito grande, da ordem de milhares de unidades, a propagação de uma perturbação |∆|, mesmo pequena, poderá prejudicar o resultado ↦ = .
  54. ∆ , (∆) Em problemas mau condicionados, a altura do

    retângulo do erro propagado por em é exageradamente grande. Como um edifício que vai além das nuvens!
  55. É a mais pura verdade, Galileu, 1 cm é gigantesco

    para grandezas atômicas, mas nem entra em cogitação para uma viagem de avião. É importante observar que medidas absolutas dependem da ordem de grandeza das coisas.
  56. Vocês estão corretos! Além do condicionamento absoluto de um problema,

    existe também o condicionamento relativo. Ele é dado pelo limite do quociente entre as variações relativas da em Τ , (∆)() (), e do argumento em Τ , ∆ : (, ) = lim ∆→0 Τ |(∆)() ()| Τ |∆ | , desde que as divisões sejam possíveis, é claro.
  57. Efetuando as contas dentro do limite, obtemos: Τ − |()

    | Τ − | | = − − × || | | Portanto o condicionamento relativo de uma função f num ponto ∈ (, ) ⊂ () é calculado pela fórmula: , = , ≠ 0.
  58. Agora, tudo se repete, como no caso do condicionamento absoluto.

    Se ↦ = () é suave em , então: |(Δ)()| |()| ≅ , Δ Sim Mestre, basta substituirmos o erro absoluto pelo erro relativo!
  59. Δ , |(Δ)()| |()| Isso mesmo Loirinha, inclusive o retângulo

    de propagação do erro por em , trocando medidas absolutas por relativas! Erro relativo em () Erro relativo em
  60. Lembro bem Galileu, o Eps depende apenas de estarmos usando

    Singles, Doubles ou Quads (32, 64 ou 128 bits). Lembrem-se nos computadores (leia IEEE 754/2008) o erro relativo é sempre o Eps, que independe dos números envolvidos.
  61. Portanto, considerando um erro relativo ℰ () = em ,

    então ℰ ( ) ≅ , Sim Cabelos de Fogo, essa é a forma de estimar o erro relativo ℰ ( ) propagado pela em .
  62. Agora passaremos a analisar o número de condicionamento das funções

    elementares. Porque todas as outras são calculadas (no computador) através delas.
  63. Mestre qual é o número de condicionamento da adição/subtração? Para

    simplificar trabalharemos com ↦ = ± , com a > 0, fixo. Então = ±1 de modo que = = 1, e o condicionamento absoluto é ótimo.
  64. Já o condicionamento relativo é dado por = | |

    = = ± ∙ 1 Em particular, na subtração, para = + , com > 0, teremos ↦ = − = − + = −. Logo = + = + 1
  65. Portanto, quanto menor o valor de tanto maior será .

    Por exemplo, para = 1 e = 0.001, teremos = 1 0.001 + 1 = 1001.
  66. Nesse caso o erro relativo será ampliado em 1.000 vezes.

    Quero comparar com as proporções da Kingdom Tower!
  67. É fácil Surfista, olhando para a escala vemos que a

    Kingdom Tower tem 1.000 de altura e uma base ≈ 100. Se nosso edifício de erro relativo tivesse uma base igual, sua altura seria de 100 = 100 × 1.000 E pensar que o nosso Pão de Açúcar tem míseros 395!
  68. Esta situação aponta um problema clássico, conhecido como cancelamento catastrófico.

    Não entendi o porque do nome cancelamento catastrófico!
  69. f Quando os números são aproximadamente iguais, todos os bits

    mais significativos da fração são iguais e, na subtração, eles se cancelam, restanto os últimos. Como, com 99 ,99% de certeza, os floats32 apresentam erro na 24ª casa binária da fração, após a normalização, esse erro é então promovido para as primeiras casas. 0 0 0 0 X X
  70. Usando um programa feito pelos Mestres (mostrado no final deste

    conjunto de transparências) poderemos ver o que acontece na prática! Sim, como exemplo usaremos ↦ = − 294. e = 294,001.
  71. Agora entendi perfeitamente o nome cancelamento catastrófico! Perdemos 4.5 dígitos

    dos 6 de float32. E o erro relativo é quase 300.000 vezes o Eps.
  72. Claro que, quanto maior a quantidade de bits na fração,

    melhor a aproximação. É o motivo fundamental de Python, dos Físicos e Engenheiros usarem precisão dupla. Trabalhando com precisão dupla (float64) conseguimos uma resposta correta, posto que, para = 294.001, = − 294. = 0.00099⋯ 76 ≅ 0.001. Dos 15 dígitos ficamos com 10.2 – uma boa margem de confiança.
  73. Então Loirinha, a multiplicação por a, é dada por =

    ∗ , Portanto = . Assim temos = = . Mestre qual é o condicionamento da multiplicação?
  74. Portanto multiplicar por valores grandes amplifica o erro absoluto. Maior

    o multiplicador, maior é o erro absoluto no produto Observem que lim →∞ () = + ∞
  75. Já o condicionamento relativo é dado por = | |

    = = ∗ = 1 ∙ Assim, o condicionamento relativo da multiplicação é ótimo.
  76. Mestre e no caso da divisão? Então Loirinha, a divisão

    de a por é dada por = /, Portanto = −/2. Assim temos = = /2.
  77. Observem que lim →0 () = + ∞ Assim, dividir

    por valores pequenos propaga muito o erro absoluto.
  78. Já o condicionamento relativo da divisão é dado por =

    | | = = / /2 = 1 ∙ Assim, o condicionamento relativo da divisão também é ótimo.
  79. Mestre, a raiz quadrada, também é uma operação implementada como

    elementar no IEEE 754. Como é o condicionamento de ? Então Loirinha, seja r a função radiciação, = , para ≥ 0. Sabemos que = Τ 1 2 , ≠ 0 . Assim temos, para > 0: = = Τ 1 2 .
  80. Observem que lim →0 , = + ∞ Assim, extrair

    a raiz quadrada de valores pequenos de propaga muito o erro absoluto.
  81. Já o condicionamento relativo da radiciação é dado, para >

    0, por = || | | = = 1/2 = 1/2 ∙ Assim, o condicionamento relativo da radiciação também é ótimo.
  82. Escolhi = 0.00002, um valor bem pequeno. Pelos resultados parece

    que não teremos muitos problemas na radiciação.
  83. E devolverá os valores de , e , . Ele

    estimará também os erros absoluto e relativo propagados por f em a partir de () e Eps. Vamos mostrar o programa prometido. Ele receberá: • a expressão () da função f , • a expressão de sua derivada , • o valor de .
  84. Vou usar o programa do Mestre para as funções: ()

    (, ) (, ) ||−1 n () () || () Τ 1 Τ 1 () () | | | | () | | | ()| () 2() | ( + ())| () Τ 1 1 − 2 Τ | | 1 − 2
  85. Antes de encerrar, recomendamos fortemente a leitura deste artigo, colocado

    em “Leituras adicionais”, no site do Mestre.