Если бы знаменитый американский писатель О'Генри (а его настоящее имя Уильям Сидней Партер) интересовался наукой физикой, то в одном из его рассказов обязательно был бы такой эпизод:
«Где-то в Калифорнии сидит под деревом ковбой в пыльной, порванной одежде с разбитым в кровь лицом. И время от времени радостно восклицает: «Как хорошо, что пополам! Как хорошо, что пополам!».
Его друг, проезжавший мимо на лошади, останавливается и недоумённо спрашивает:
- Что с тобой, Джимми?
- Лошадь сбросила.
- А причём здесь «пополам»?
- Радуюсь, что в формуле кинетической энергии есть множитель одна вторая. А то я бы ударился об дерево в два раза сильнее. И теперь не беседовал бы с тобой, Джон».
1. Энергия и импульс
Действительно, а почему в формуле кинетической энергии
стоит множитель одна вторая?
Несложно представить такой выбор единиц измерения физических величин, при которых этот множитель будет ненужным. Можно было в качестве единицы массы брать не «килограмм», а половину нынешнего килограмма. Можно было изменить единицы измерения расстояния или времени (и, соответственно, скорости), при которых множитель 1/2 исчез бы. Наконец, можно и саму энергию измерять в других единицах. Впрочем, вместо 1/2 могло оказаться и какое-то другое число. Почему стоит именно 1/2?
Это не случайно. Дело в том, что если от выражения кинетической энергии взять производную по скорости (точнее, частные производные по трём составляющим направления скорости в пространстве), то получим выражение другой очень важной физической величины – импульса:
.
При вычислении производной от степенной функции, как известно, степень, в которую возводилась переменная, понижается на единицу. При этом коэффициент степени становится сомножителем при производной. Вот эта вторая степень при скорости и, кстати, оказавшийся коэффициент 1/2 взаимно сократились.
С неизбежностью, либо в выражении кинетической энергии, либо в выражении импульса должен появиться коэффициент, отличный от единицы. Возможен, конечно, и худший случай, когда вследствие выбора единиц измерения энергии, массы и скорости коэффициенты, отличные от единицы, появляются в обеих этих формулах. Тогда коэффициент в выражении импульса будет в два раза больше, чем коэффициент в выражении кинетической энергии.
Можно сказать, что импульс в каком-то смысле информативнее кинетической энергии. Дело в том, что импульс имеет направление, совпадающее с направлением скорости. Чтобы подчеркнуть, что импульс векторная величина, имеющая направление, над скоростью в приведённом выше выражении поставлена стрелочка.
На самом деле выражение импульса состоит как бы из трёх выражений, задающих не только абсолютную величину, но и направление импульса в трёхмерном пространстве.
Пусть началом координат в этом пространстве является вершина какого-то (неважно, где и как расположенного) кубика. Выходящие из этой вершины три ребра можно рассматривать как направления координат x, y, z в нашем пространстве. Тогда вектор скорости однозначно определяется его тремя координатами υx, υy, υz. Соответственно, и вектор импульса представляется своими тремя координатами
px = mυx, py = mυy, pz = mυz.
Из координат вектора скорости можно определить, используя теорему Пифагора, абсолютную величину скорости
,
а зная массу – абсолютную величину импульса , а также величину потенциальной энергии
.
Заметим, импульс задаётся тремя выражениями, поскольку эта величина векторная. Кинетическая энергия задаётся одним выражением, поскольку это скалярная (выражаемая одним вещественным числом) величина.
Возможно, именно потому, что импульс более информативен, чем кинетическая энергия, физики предложили использовать такие системы измерения физических величин, при которых у импульса коэффициент равен единице. Что с неизбежностью повлекло необходимость коэффициента 1/2 в формуле кинетической энергии.
Надо сказать, что математики в тех многочисленных случаях, когда приходится использовать квадратичные зависимости, стараются ставить перед этими зависимостями коэффициент 1/2. Это облегчает дальнейшую работу с моделями или алгоритмами, если в последующем будут активно применяться производные от этих выражений.
2. Тепловая теорема Максвелла
В любой системе проводников, где нет источников Э.Д.С. и токи отвечают закону Ома, тепло, генерируемое установившимся токораспределением, всегда меньше, чем тепло, генерируемое токами, распределёнными любым другим образом, но согласующимися с условиями протекания и вытекания.
Дж.К. Максвелл «Трактат об электричестве и магнетизме»
Не поставленный перед квадратом коэффициент «одна вторая» может привести к крупным недоразумениям. Источником одного такого недоразумения оказался великий учёный Джеймс Кларк Максвелл. Он был основателем знаменитой Кавендишской лаборатории, создателем единой теории электромагнитного поля. Все открытые к середине XIX века законы электричества (Кулона, Ампера, Фарадея) были обобщены им в виде широко известной ныне системы уравнений Максвелла.
Максвелл был автором многих других крупных открытий. Об одном из них пойдёт речь в данном разделе. В книге «Трактат об электричестве и магнетизме», посвящённой изложению теории электромагнитных явлений, приводится побочный (для основной цели книги) факт – «тепловая теорема Максвелла». Формулировка этой теоремы использована в качестве эпиграфа к данному разделу.
В «тепловой теореме» констатируется очень любопытный эффект, относящийся к электрическим цепям. Ныне электрические цепи изучают в школе. Так принято называть математическую модель связанных между собой проводников электричества, содержащих сопротивление, источники электродвижущей силы (Э.Д.С.) и, возможно, другие устройства (например, полупроводники). Электрическая цепь представляется в виде графа. Графом называется математический объект, состоящий из некоторого набора «узлов» и некоторого набора «связей» между этими узлами. Эти связи называются дугами графа.
На рис. 1 представлен пример схемы электрической цепи в виде направленного графа. Кружочки обозначают узлы графа. Цифры внутри них – номера узлов. Граф ориентированный, то есть каждая дуга имеет направление. Стрелки с прямоугольниками соответствуют дугам графа. Цифры в прямоугольниках – номера дуг.
Задача 1. Необходимо найти силу тока по каждой из дуг в случае, когда по рассматриваемой цепи между узлами 1 и 3 протекает ток в 1 А (ампер), электрическое сопротивление (измеряемое в омах) каждой из дуг соответствует величинам
R1 = R3 = R5 = 1 Ом, R2 = R4 = 2 Ом.
Для решения данной задачи необходимо, прежде всего, сформулировать все её условия. Эти условия отражают два закона Кирхгофа и закон Ома.
Первый закон Кирхгофа состоит в том, что сумма втекающих и вытекающих токов для данного узла должна быть равна нулю. Запишем это последовательно для всех рассматриваемых узлов i=1,2,3,4.
–I1 – I4 = –10 (1),
I1 – I2 – I5 = 0 (2),
I2 + I3 = 10 (3),
–I3 + I4 + I5 = 0 (4).
Здесь Ij – искомые величины тока по дугам j = 1,2,3,4,5. Надо напомнить, что термины «ток» и «сила тока» являются синонимами. Первый чаще используется в электротехнике, второй – в физике. В данной статье мы будем использовать оба.
Величины силы тока в -10 А и в +10 А в правых частях первого и третьего уравнений означают, что это заданные значения. Причём в первом уравнении 10 А – это сила тока, «поставляемая» в систему.
Если величину -10 А «перебросить» в левую часть данного уравнения, то она получит знак «плюс». В третьем уравнении величина 10 А представляет заданную силу тока, «вытекающего» из рассматриваемой системы проводников.
Второй закон Кирхгофа
Если первый закон Кирхгофа отражает довольно простую идею (сколько «втекает» в каждый узел, столько и «вытекает»), то второй закон Кирхгофа в формулировке самого Кирхгофа, которая обычно используется и в настоящее время, имеет существенно более громоздкий вид: сумма напряжений по дугам, составляющим любой замкнутый контур, должна быть равна сумме Э.Д.С. на всех дугах данного контура.
Для восприятия этого закона требуется вспомнить, что замкнутый контур – это последовательность «состыкованных» узлов и дуг графа, начинающаяся и заканчивающаяся в одном и том же узле. Важно также, что при суммировании здесь Э.Д.С. берутся с разными знаками, в зависимости от того, совпадает или нет их ориентация с выраженным направлением обхода данного замкнутого контура.
Самому Кирхгофу, похоже, его «второй» закон по нынешней нумерации, представлялся более интересным. И изначально он считал его «первым». А тот, который сейчас считается первым, у Кирхгофа был «вторым» законом.
Можно сформулировать «второй» закон более просто, совершенно симметрично формулировке «первого» закона. Если первый закон – баланс токов в узлах, то второй – баланс напряжений по дугам графа электрической цепи.
Введём дополнительные параметры. Пусть ui – потенциал в узле i=1,...,4 , yj – напряжение на дуге j. Второй закон Кирхгофа для дуги, на которой нет Э.Д.С., можно записать в таком виде:
yj = ukj – ukj,
где kj – номер узла, в котором начинается дуга j. Для рассматриваемой здесь схемы имеем пять уравнений, последовательно для дуг с номерами j=1,2,...,5.
U1 = u1 – u2,
U2 = u2 – u3,
U3 = u4 – u3,
U4 = u1 – u4,
U5 = u2 – u4.
Закон Ома является связующим звеном между переменными, характеризующими напряжение и силу тока на каждой дуге. Согласно этому закону
Uj = RjIj, j = 1,…,5,
где Rj – коэффициент электрического сопротивления проводника.
Итак, рассматриваемую задачу мы представили в виде системы линейных уравнений с 14 неизвестными: пять из них представляют силы тока по разным дугам, пять – напряжения по дугам, четыре – потенциалы в узлах. Имеется также 14 уравнений. Четыре из них выражают первый закон Кирхгофа, пять – второй закон и пять – закон Ома.
При этом система условий является избыточной (выражение первого закона Кирхгофа для любого из узлов можно формально получить, суммируя выражения этого же закона, заданного для остальных узлов). Система также имеет неоднозначное решение по переменным, характеризующим потенциалы в узлах. Эти оба свойства означают, что можно исключить из рассмотрения балансов условие первого закона Кирхгофа для одного из узлов и положить для данного узла какое-либо фиксированное значение потенциала, например, нулевое. В данной задаче, как и в других аналогичных случаях, электрический потенциал – величина относительная.
Фиксируем на нулевом уровне напряжение в первом узле. Тогда решением приведенной системы линейных уравнений будут следующие значения её переменных
u1 = 0, u2 = 6, u3 = 14, u4 = 8,
y1 = y3 = 6, y2 = y4 = 8, y5 = 2,
I1 = I3 = 6, I2 = I4 = 4, I5 = 2.
Здесь потенциалы в узлах и напряжения по дугам измеряются в вольтах, сила тока – в амперах.
Ток распределяется по проводникам, минимизируя расход мощности.
Как известно, потребляемая мощность N при прохождении тока I по проводнику с сопротивлением R определяется по формуле
N=R·I2.
Если сопротивление измеряется в омах, ток – в амперах, то мощность в этой формуле измеряется в ваттах. Если потребляемую мощность умножить на время, то получим выделяемую энергию, в частности, тепловую.
Согласно теореме Максвелла, в нашем примере ток, распределяясь по проводникам, решает следующую задачу оптимизации
при ограничениях
I1 – I2 – I5 = 0, I2 + I3 = 10, –I3 + I4 + I5 = 0.
Здесь упущено балансовое условие для токов, входящих в первый узел и выходящих из него, поскольку его, как отмечалось, можно рассматривать как следствие из балансовых условий для остальных узлов.
Действительно, сложим левые и правые части приведённых здесь равенств. Получим равенство, эквивалентное балансовому условию токов по первому закону Кирхгофа для первого узла
I1 + I4 = 10.
Функция F˜ называется целевой. Её также называют критерием оптимизации. В нашем примере она имеет вид
.
То есть ток, распределяясь по проводникам, стремится к тому, чтобы как можно меньше выделилось энергии (тепла) за единицу времени суммарно по всем проводникам.
Решается задача минимизации функции F˜ при указанных ограничениях. Это означает, что нам необходимо найти такое решение I1, I2, I3, I4, I5, удовлетворяющее приведенным выше балансовым условиям, что для любого другого решения , также удовлетворяющего этим условиям, выполняется неравенство
.
Для полученного ранее токораспределения в нашем примере потеря мощности составляет 140 ватт. По 36 ватт в 1-й и 3-й дуге, по 32 ватта во 2-й и в 4-й дуге и 4 ватта в пятой дуге.
Возьмём какое-либо другое распределение токов, удовлетворяющих первому закону Кирхгофа во всех узлах. Например, I˜1 = I1, I˜2 = I2–1, I˜3 = I3+1, I˜4 = I4, I˜5 = I5+1. Здесь Ij – сила тока по дуге j из приведённого выше решения. Для нового решения потери мощности составят 144 ватта, что больше на 4 ватта, чем ранее вычисленные потери для оптимального решения.
Заметим, в приведенной задаче оптимизации в выражениях учитывается только первый закон Кирхгофа. В условиях нет в явном виде второго закона Кирхгофа, нет закона Ома. Вместо этих двух законов постулируется полумистическое, на первый взгляд, правило «разумного» поведения электрического тока – он перераспределяется между проводниками таким образом, чтобы суммарные потери мощности между всеми проводниками были наименьшими. Причём доказательство Максвеллом своей тепловой теоремы является безупречным.
3. И почему всё-таки нельзя считать правильной тепловую теорему Максвелла?
«Если сделать так, чтобы токи протекали через массу вещества, удовлетворяющего закону Ома, то токи распределяются в этой массе так, чтобы скорость, с которой генерируется в ней тепло, была бы наименьшей».
Ричард Фейнман «Фейнмановские лекции по физике, т. 6» (Р. Фейнман, Р. Лейтонг, М. Сэпус).
Приведенное высказывание Р. Фейнмана из его знаменитых лекций по физике показывает, насколько велика убеждённость в справедливости тепловой теоремы Максвелла. Увы, оно не верно. Дело в том, что целевую функцию любой задачи оптимизации можно умножить на какую-либо положительную константу. Задача с новой, полученной в результате такого умножения целевой функцией будет иметь то же самое оптимальное решение. В «тепловой теореме» могли фигурировать не сами потери мощности, а удвоенные или утроенные потери. Это могла быть и какая-либо фиксированная часть этой мощности. Вопрос о том, какой именно должна быть константа, оставался невыясненным (хотя и незамеченным) после доказательства «тепловой теоремы» Максвелла.
На самом деле, было бы правильным использовать не саму расходуемую мощность (энергию за единицу времени), а ровно её половину. Так, в рассмотренном выше примере следовало бы заменить целевую функцию F˜ функцией
.
Что даёт такая замена?
- В этом случае множители Лагранжа ограничений задачи оптимизации принимают чёткий физический смысл. Французский математик Лагранж предложил для исследования задач оптимизации с ограничениями добавлять к целевой функции зависимости, выражающие ограничения задачи, умноженные на некоторые (искомые) величины. Эти величины получили название «множители Лагранжа». Они показывают, насколько сдерживают те либо иные ограничения возможность уменьшения (для задачи минимизации) значения целевой функции. Сама новая функция получила название функции Лагранжа. В функции Лагранжа, кроме переменных исходной задачи, в качестве искомых величин рассматриваются также множители Лагранжа, равные по количеству ограничений. Для рассматриваемого примера функция Лагранжа имеет вид
.
Здесь в качестве аргументов функции L символически указаны наборы всех рассматриваемых переменных Ij и uj.
Рассмотренная в предыдущем разделе задача оптимизации относится к классу задач минимизации дифференцируемой выпуклой функции при линейных ограничениях-равенствах. Необходимым и достаточным условием того, чтобы какое-либо решение было оптимальным для этой задачи, является равенство нулю производных функции Лагранжа для всех переменных.
Если взять производные функции Лагранжа по всем её переменным Ij и uj, то получим систему линейных уравнений, выражающую первый и второй законы Кирхгофа. В этой системе также будет учтён закон Ома, поскольку вместо величины напряжения Uj будут рассматриваться сразу его выражения Rj, Ij по этому закону.
При использовании в качестве целевой функции F множителя Лагранжа ограничения имеют чёткий физический смысл – они являются потенциалами в узлах. Если же в качестве целевой брать исходную функцию F˜, то множители Лагранжа будут равны удвоенным потенциалам в отдельных узлах, что не физично.
- Появляется возможность представлять в виде задачи оптимизации токораспределение не только «пассивных», но и «активных» электрических цепей. В приведенной формулировке «тепловой теоремы» Максвелл сделал оговорку, что она справедлива для электрических цепей, где нет источников «электродвижущей силы», Э.Д.С. Такие цепи принято называть пассивными. И не случайно наш исходный пример был без источников Э.Д.С.
Если в целевой функции при потере мощности на отдельных сопротивлениях ставить коэффициент 1/2, то легко можно перейти к представлению её в виде задачи оптимизации для «активных» электрических цепей, в которых есть источники Э.Д.С. Для этого следует добавить к целевой функции всю вырабатываемую каждым источником Э.Д.С. мощность, но с обратным знаком.
Задача 2. Видоизменим рассматриваемый пример. Пусть цепь будет уже не открытой, в которую извне втекает и вовне вытекает заданный ток. Пусть цепь будет замкнутой – первые и третьи узлы соединены дугой, на которой расположен источник Э.Д.С. Номер этой новой связи будем считать нулевым. Добавляется ещё одна переменная – сила тока I0 на этой дуге. Напряжение введённой Э.Д.С. обозначим U0. Пусть U0 = 14 вольт.
Для этой задачи расчёт силы токов и напряжения в узлах представляется в виде такой проблемы оптимизации:
при условиях
I1 – I2 – I5 = 0, I2 + I3 – I0 = 0, –I3 + I4 + I5 = 0.
Здесь сила тока I0 уже не заданная, а переменная, искомая величина. Заданной является разность напряжения U0 на нулевой дуге.
В условиях задачи выписаны балансы токов во втором, третьем и четвёртом узлах. Если сложить эти равенства, то получим выражение, равносильное балансу токов в первом узле
I0 – I1 – I4 = 0.
Поэтому данное условие излишне для задачи. Его исключение из рассмотрения автоматически означает, что множитель Лагранжа для него считается нулевым.
Для этой модифицированной задачи множители Лагранжа также будут соответствовать напряжениям в отдельных узлах. Для задачи 2 исходную величину U0 нужно взять такую, чтобы её решение численно совпадало с решением задачи 1.
Если для новой задачи запишем функцию Лагранжа и приравняем её производную к нулю, то получим систему линейных уравнений, включающую приведенные выше выражения первого закона Кирхгофа для узлов и выражения, представляющие второй закон Кирхгофа и закон Ома:
R1I1 = u1 – u2, R2I2 = u2 – u1,
R3I3 = u4 – u3, R4I4 = u1 – u2,
R5I5 = u2 – u4, u3 – u1 = y0.
Заданной является величина U0. Считается, что u1=0. Величина uj, как и множители Лагранжа ограничений, является ничем иным, кроме как потенциалом в узлах.
- Появляется возможность использования нового класса задач оптимизации при расчёте электрических цепей – двойственные задачи, осуществляющие наилучшее распределение не токов, а напряжений в электрических цепях. Симметрии, как и подобия, возникающие в самых неожиданных местах, являются украшениями мироздания.
Если бы Максвелл ввёл в целевую функцию в своей задаче оптимизации коэффициент 1/2, то он легко бы обнаружил существование другой, совершенно симметричной рассмотренной им, задачи оптимизации. Оказывается, можно говорить не только о том, что токи так распределяются по проводникам, чтобы минимизировать потери мощности (точнее, как мы теперь знаем, одну вторую потерь), но и напряжения распределяются с проявлением не меньшего «интеллекта». Оказывается, что потенциалы и напряжение в системе проводников распределяются так, чтобы минимизировать также половину (но уже другую) потерь мощности.
У закона Ома есть другая форма записи. Можно рассматривать, как это было выше, напряжение между концами проводников как функцию от силы тока. А можно и наоборот – силу тока представлять как функцию от напряжения
I = ПU.
Здесь
П = 1/R
– величина, обратная коэффициенту сопротивления R, которая называется коэффициентом проводимости.
Расходуемую в данном проводнике мощность можно представлять не только в виде квадратичной функции от силы тока (как это было у нас выше), но и как квадратичную функцию от напряжения,
N = ПU2.
Появляется возможность рассматривать задачу расчёта электрической цепи как задачу оптимизации распределения напряжения, в которой минимизируется потребляемая мощность (точнее половина) её в указанной здесь форме.
Система ограничений этой задачи будет состоять из уравнений второго закона Кирхгофа. Первый закон Кирхгофа у этой задачи в явном виде не обнаруживается. Если же мы возьмём производные функции Лагранжа этой новой задачи оптимизации и приравняем их к нулю, то получим систему условий, выражающих как второй, так и первый законы Кирхгофа, а также закон Ома. В данном случае множителями Лагранжа ограничений будут величины, равные силе тока в разных проводниках.
Эту новую, обсуждаемую здесь задачу оптимизации принято называть двойственной задачей оптимизации (к исходной задаче оптимизации токораспределения). Причём в данном случае имеет место симметричная двойственность. То, что мы, вслед за Максвеллом, стали рассматривать в качестве «исходной» задачу оптимизации токораспределения, совершенно случайное явление. С тем же успехом мы могли взять за исходную задачу оптимизации распределения напряжений.
Проиллюстрируем принцип построения двойственных задач оптимизации применительно к рассмотренным выше двум задачам. В обоих случаях
– функция, равная половине потерь мощности в рассматриваемых проводниках, когда потери мощности определяются через разности напряжений yi и коэффициенты проводимости Пi.
Двойственная к задаче 1. Необходимо найти потенциалы в узлах ui и напряжения по дугам, исходя из решения задачи оптимизации
Ф(U1, U2, U3, U4, U5) – I0U0 → min,
при условиях
U1 – (u1 – u2) = 0, U2 – (u2 – u3) = 0,
U3 – (u4 – u5) = 0, U4 – (u1 – u4) = 0,
U5 – (u2 – u1) = 0, U0 – (u3 – u1) = 0.
Заданной является здесь величина силы тока I0 = 10 A.
Множителями Лагранжа для этой задачи будут переменные величины, равные силе тока по каждой рассматриваемой дуге. Приравняв производные функции Лагранжа этой задачи по всем её переменным, получим систему уравнений, совпадающую с исходной системой, содержащей выражение двух законов Кирхгофа и закона Ома. В рассматриваемой задаче оптимизации значения потенциалов в узлах имеются множественные значения для оптимального решения. Если положить u1 = 0, то придём к однозначности значений потенциалов в остальных узлах.
Двойственная к задаче 2. В этом случае заданной будет величина U0. Поэтому составляющая I0U0 исключается из целевой функции, и в последнем ограничении величина U0 переходит в правую часть условия. Задача имеет вид:
Ф(U1, … , U5) → min,
при условиях
U1 – (u1 – u2) = 0, U2 – (u2 – u3) = 0,
U3 – (u4 – u5) = 0, U4 – (u1 – u2) = 0,
U5 – (u2 – u1) = 0, U0 – (u3 – u1) = 0.
Предлагается читателям самим составить функцию Лагранжа для двойственной к задаче 1 и для двойственной к задаче 2. Приравняв производные функций Лагранжа нулю по всем её переменным, можем получить системы уравнений, выражающие два закона Кирхгофа и закон Ома для задачи 1 и для задачи 2.
На рис. 2, 3 графически отображены две рассмотренные нами формы представлений закона Ома. Первая из них – в виде зависимости напряжения от силы тока. Вторая форма – зависимость силы тока от напряжения. В обоих случаях между напряжением и силой тока на данном участке цепи существует взаимно однозначное соответствие. Площадь всех заштрихованных прямоугольников в обоих случаях равна произведению силы тока на напряжение и соответствует потере мощности
N = UI.
Площадь треугольника, обозначенная буквой F, соответствует половине потери мощности, рассматриваемой в целевой функции исходных задач. Площадь треугольника, обозначенная буквой Ф, соответствует второй половине потери мощности, которая рассматривается в двойственных задачах.
Прямая и двойственная задачи оптимизации связаны одним важным фактом U. Сумма их целевых функций для оптимальных решений равна нулю. Для первой из рассмотренных задач это означает выполнение неравенства
.
Здесь сумма первых двух величин равна потерям мощности в сети. Величина I0U0 соответствует мощности, которую надо приложить извне для того, чтобы ток I0 пошёл из рассматриваемой системы проводников. В конечном итоге, приведенное соотношение можно интерпретировать как закон сохранения энергии (в единицу времени, что соответствует мощности). Мощность, прилагаемая извне, должна равняться потере мощности в системе.
Равенство нулю суммы оптимальных значений целевых функций исходной и двойственной задачи 2 даёт такое же соотношение. И оно выполняется не только для рассмотренных задач, но и в общем случае.
В.И. Зоркальцев, доктор технических наук, профессор Лимнологического института (г. Иркутск ) СО РАН