Шрифт:
Интервал:
Закладка:
Мы можем пояснить такую конструкцию с помощью алгебры. Предположим, что величина x (в нашем случае 2) слегка изменяется и становится равной x + Δx (в нашем примере 2,001). Символ Δx означает приращение x, то есть небольшое изменение x (у нас Δx = 0,001). И когда мы спрашиваем, чему равно (2,001)3, мы на самом деле спрашиваем, чему равно (x + Δx)3. Перемножив его (используя треугольник Паскаля или формулу бинома), получаем:
(x + Δx)3 = x3 + 3x2Δx + 3x(Δx)2 + (Δx)3.
В нашей задаче, где x = 2, это уравнение принимает вид
(2 + Δx)3 = 23 + 3(2)2Δx + 3(2)(Δx)2 + (Δx)3 = 8 + 12Δx + 6(Δx)2 + (Δx)3.
Теперь мы видим, почему добавка к 8 состоит из трех частей различной величины. Малая, но главная часть равна 12Δx = 12×0,001 = 0,012. Оставшиеся части 6(Δx)2 и (Δx)3 отвечают за сверхмалую 0,000006 и сверхсверхмалую 0,000000001 величины. Чем больше множителей Δx входит в слагаемое, тем оно меньше. Вот почему они ранжируются по размеру. Каждое лишнее умножение на маленькое число Δx делает малую величину еще меньше.
В этом небольшом примере хорошо видна ключевая идея дифференциального исчисления. Во многих ситуациях, касающихся причины и следствия, дозы и реакции, входа и выхода, а также иной взаимосвязи между переменной x и зависящей от нее переменной y, небольшое изменение на входе Δx приводит к небольшому изменению на выходе Δy. Это небольшое изменение, как правило, организовано структурированным способом, который мы можем изучить, а именно: изменение на выходе организовано иерархически из нескольких частей. Они ранжированы по размеру от малого вклада до сверхмалого и еще меньших вкладов. Такая градация позволяет нам сосредоточиться на части, пусть и малой, но вносящей основной вклад, и пренебречь всеми остальными частями – сверхмалыми и еще меньшими. Именно в этом и состоит основная идея. Хотя малое изменение мало, оно колоссально по сравнению с другими (как в нашем примере число 0,12 огромно по сравнению с 0,000006 и 0,000000001).
Дифференциалы
Такой способ мышления, когда мы пренебрегаем всеми вкладами в правильный ответ, кроме самой крупной, львиной доли, может показаться только приблизительным. И это так, если изменения на входе вроде числа 0,001, добавленного нами к 2, – это конечные изменения. Но если мы рассмотрим бесконечно малые изменения на входе, то наш метод мышления станет точным. Ошибок не будет. Львиная доля становится всем. И, как мы уже говорили в этой книге, бесконечно малые изменения – именно то, что нам нужно, чтобы понимать наклоны, мгновенные скорости и площади криволинейных областей.
Чтобы посмотреть, как это работает на практике, давайте вернемся к примеру выше, когда мы пытались вычислить куб числа, слегка превышающего 2. Только теперь изменим число с 2 на 2+dx, где dx – бесконечно малое приращение Δx. Это понятие по своей сути не отличается осмысленностью, так что не думайте о нем слишком усердно. Главное тут – знать, что понимание того, как это работает, упрощает вычисления.
Предыдущая формула (2 + Δx)3 = 8 + 12Δx + 6(Δx)2 + (Δx)3, в частности, теперь сокращается до более простой:
(2 + dx)3 = 8 + 12dx.
Что произошло с остальными слагаемыми вида 6(dx)2 + (dx)3? Мы их отбросили. Ими можно пренебречь. Эти сверхмалые и сверхсверхмалые величины пренебрежимо малы по сравнению с 12dx. Но почему тогда мы сохранили 12dx? Разве эта величина не пренебрежимо мала по сравнению с 8? Да, но если бы мы отбросили еще и ее, то не учли бы вообще никаких изменений, и ответ остался бы 8. Поэтому рецепт таков: для изучения бесконечно малых изменений сохраните слагаемые, включающие dx в первой степени, и игнорируйте все остальные.
Такой способ мышления, использующий бесконечно малые величины вроде dx, можно переформулировать в терминах пределов и сделать совершенно кошерным и строгим. Современные учебники действуют именно так. Но быстрее и проще использовать бесконечно малые величины. Специальный термин для них в этом контексте – дифференциалы Это название проистекает от их представления в виде разностей Δx и Δy, когда эти разности в пределе стремятся к нулю[240]. Это похоже на то, что мы видели, когда рассматривали параболу под микроскопом и наблюдали, как кривая становится все прямее и прямее при увеличении.
Производные через дифференциалы
Позвольте вам показать, насколько простыми становятся некоторые идеи, если подходить к ним через дифференциалы. Например, что такое наклон кривой, если рассматривать ее в виде графика на координатной плоскости? Как мы узнали из нашей работы с параболой в главе 6, наклон – это производная, определяемая как предел Δy / Δx, когда Δx стремится к нулю. А чем он будет в терминах дифференциалов? Просто dy / dx. Словно кривая составлена из крохотных прямых линий.
Если мы представим dy как бесконечно малое приращение по вертикали, а dx – как бесконечно малое приращение по горизонтали, то наклон будет просто их отношением, как и всегда для наклонного пандуса, и, следовательно, составит dy / dx.
Чтобы применить этот подход к конкретной кривой (например, y = x3, которую мы использовали, возводя в куб числа, слегка превосходящие 2), вычислим dy следующим образом. Пишем:
y + dy = (x + dx)3.
Как и раньше, раскрываем скобки справа и получаем
(x + dx)3 = x3 + 3x2dx + 3x(dx)2 + (dx)3.
Теперь в соответствии с нашим рецептом отбрасываем слагаемые (dx)2 и (dx)3, потому что они не входят в львиную долю. Таким образом, у нас получается
y + dy = (x + dx)3 = x3 + 3x2dx.