Основная теорема анализа. Основная теорема путевого анализа Основная теорема анализа

Основная теорема анализа

Основная теорема анализа или формула Ньютона - Лейбница даёт соотношение между двумя операциями: взятием определенного интеграла и вычислением первообразной

Формулировка

Рассмотрим интеграл от функции y = f (x ) в пределах от постоянного числа a до числа x , которое будем считать переменным. Запишем интеграл в следующем виде:

Данный вид интеграла называется интегралом с переменным верхним пределом. Используя теорему о среднем в определённом интеграле , легко показать что данная функция непрерывная и дифференцируемая. А также производная от данной функции в точке x равна самой интегрируемой функции. От сюда следует, что любая непрерывная функция имеет первообразную в виде квадратуры: . А так как класс первообразных функций функции f отличается на константу, легко показать, что: определенный интеграл от функции f на равен разности значений первообразных в точках b и а


Wikimedia Foundation . 2010 .

  • Плеяда
  • 6174 (число)

Смотреть что такое "Основная теорема анализа" в других словарях:

    Основная теорема о вычетах - Теорема о вычетах явлется мощным инструментом для вычисления интеграла мероморфной функции по замкнутому контуру. Ее часто используют также для вычисления вещественных интегралов. Она является обобщением интегральной теоремы Коши и интегральной… … Википедия

    Основная теорема алгебры - утверждает, что Всякий отличный от константы многочлен (от одной переменной) с комплексными коэффициентами имеет по крайней мере один корень в поле комплексных чисел. Эквивалентная формулировка теоремы следующая: Поле комплексных чисел… … Википедия

    Теорема Ньютона - Формула Ньютона Лейбница или основная теорема анализа даёт соотношение между двумя операциями: взятием определенного интеграла и вычислением первообразной. Если непрерывна на отрезке и ее любая первообразная на этом отрезке, то имеет … Википедия

    Формула Ньютона-Лейбница

    Формула Ньютона - Лейбница - Основная теорема анализа или формула Ньютона Лейбница даёт соотношение между двумя операциями: взятием определенного интеграла и вычислением первообразной Формулировка Рассмотрим интеграл от функции y = f(x) в пределах от постоянного числа a до… … Википедия

    Интеграл - Определённый интеграл как площадь фигуры У этого термина существуют и другие значения, см. Интеграл (значения). Интеграл функции … Википедия - для функции это совокупность всех первообразных данной функции. Если функция определена и непрерывна на промежутке и её первообразная, то есть при, то … Википедия

Понятие об интегрировании, и в некоторой мере о дифференцировании, было хорошо развито раньше работ Ньютона и Лейбница. Но было совершенно необходимо сделать одно очень простое открытие, для того чтобы дать толчок к огромной эволюции вновь созданного математического анализа. Два как будто бы взаимно не соприкасающихся предельных процесса, употребляемые ©дин для дифференцирования, другой для интегрирования функций, оказались тесно связанными между собой. В самом деле, они являются взаимно обратными операциями, подобно таким операциям, как сложение и вычитание, умножение и деление. Дифференциальное и интегральное исчисления представляют собой нечто единое.

Великое достижение Ньютона и Лейбница заключается в том, что они впервые ясно осознали и использовали эту основную теорему анализа. Без сомнения, их открытие лежало на прямом пути естественного научного развития, и нисколько не удивительно, что различные лица пришли независимо и почти одновременно к ясному пониманию указанного выше обстоятельства.

Для того чтобы точно сформулировать основную теорему, рассмотрим интеграл от функции y = f (х) в пределах от постоянного числа а до числа х, которое будем считать переменным. Чтобы не смешивать верхнего предела интегрирования х с переменной, фигурирующей под знаком интеграла, запишем интеграл в следующем виде (см. стр. 435):

демонстрируя таким образом наше намерение изучать интеграл как функцию F (х) своего верхнего предела (рис. 274). Эта функция F (х) есть площадь под кривой y = f (u) от точки u = а до точки u = х . Иногда интеграл F (х) с переменным верхним пределом называют "неопределенным интегралом".

Основная теорема анализа читается следующим образом: Производная неопределенного интеграла (1) по его верхнему пределу х равна значению функции f (u) в точке u = х:

F" (х) = f (x).

Другими словами, процесс интегрирования, ведущий от функции f(x) к функции F (x), "уничтожается" обратным ему процессом дифференцирования, применяемым к функции F (х).

На интуитивной основе доказательство этого предложения не представляет труда. Оно базируется на интерпретации интеграла F (х) как площади, и было бы затемнено, если бы мы попытались представлять функцию F (х) в виде графика и истолковывать производную F" (х) как соответствующий наклон. Оставляя в стороне установленную ранее геометрическую интерпретацию производной, мы сохраним геометрическое толкование интеграла F (х) как площади, а дифференцировать функцию F (х) станем аналитическим методом. Разность

F (х 1) - F (х)

есть просто площадь под кривой y = f (u) между пределами u = х 1 и u = х (рис. 275), и нетрудно понять что числовое значение этой площади заключено между числами (х 1 - х)m и (x 1 - х) М:

(x 1 - x)m≤F (х 1) - F (х) ≤(х 1 - х) М,

где М и m являются соответственно наибольшим и наименьшим значениями функции f (u) в промежутке от u = х до u = x 1 . Действительно, эти произведения дают площади двух прямоугольников, из которых один содержит рассматриваемую криволинейную область, а другой содержится в ней.

Отсюда следует:


Предположим, что функция f (u) непрерывна, так что при стремлении x 1 к х обе величины М и m стремятся к значению функции f (u) в точке u = х, т. е. к значению f (х). В таком случае можно считать доказанным, что

Интуитивный смысл этого результата заключается в том, что при возрастании скорость изменения площади под кривой y = f (х) равна высоте кривой в точке х.

В некоторых руководствах содержание этой основной теоремы затемняется неудачно выбранной терминологией. Именно, многие авторы сначала вводят понятие производной, а затем определяют "неопределенный интеграл" просто как результат операции, обратной по отношению к дифференцированию: они говорят, что функция G (х) есть неопределенный интеграл от функции f (х), если

G" (х) = f(x).

Таким образом, этот способ изложения непосредственно связывает дифференцирование со словом "интеграл". Только позднее вводится понятие "определенный интеграл", трактуемое как площадь или как предел последовательности сумм, причем недостаточно подчеркивается, что слово "интеграл" обозначает теперь нечто совершенно другое, чем прежде. И вот оказывается, что самое главное, что содержится в теории, приобретается лишь украдкой с черного хода, и учащийся встречается с серьезными затруднениями в своих усилиях понять существо дела. Мы предпочитаем функции G (х), для которых G" (х) = f (х) , называть не "неопределенными интегралами", а первообразными функциями от функции f (х). Тогда основная теорема может быть сформулирована следующим образом:

Функция F (х), являющаяся интегралом от функции f (x) при постоянном нижнем и переменном верхнем пределе х, есть одна из первообразных функций от функции f (x).

Мы говорим "одна из" первообразных функций по той причине, что если G (х) является первообразной функцией от f (х), то непосредственно ясно, что и любая функция вида Н (х) = G (х) + с (с - произвольная постоянная) есть также первообразная, так как Н" (х) = G" (х) . Обратное утверждение также справедливо. Две первообразные функции G (х) и Н (х) могут отличаться одна от другой не иначе, как постоянным слагаемым. Действительно, разность U (х) = G (х) - Н (х) имеет в качестве производной U" (х) = G" (х) - Н" (х) = f (х) - f (х) = 0 , т. е. эта разность постоянна, так как очевидно, что если график функции в каждой своей точке горизонтален, то сама функция, представляемая графиком, непременно должна, быть постоянной.

Первым этапом путевого анализа является идентификация уравнений системы.

В современной эконометрической литературе идентификация понимается как структурная спецификация модели, призванная не только определить значения параметров, но и выделить одну-единственную итоговую структурную модель анализируемых данных.

Проблема идентифицируемости в системе структурных уравнений связана с наличием достаточного числа ограничений, накладываемых на него моделью. Применительно к p-анализу - это проблема соответствия между количеством возможных соотношений между r ij и p ij и числом p ij .

Иначе говоря, проблема идентифицируемости структурных параметров -- это проблема достаточности эмпирических данных для оценки всех коэффициентов модели. Необходимым условием идентифицируемости уравнения является отсутствие среди линейных комбинаций оставшихся уравнений, таких, которые удовлетворяли бы всем ограничениям модели, накладываемым на исследуемое уравнение.

Это эквивалентно так называемому условию порядка: для того чтобы уравнение в системе из т линейных структурных уравнений было идентифицируемо, необходимо, чтобы в нем отсутствовало по меньшей мере т -- 1 переменных из т + к переменных, встречающихся в модели. Обозначим через т число эндогенных переменных в модели, к -- число предопределенных переменных, h -- число эндогенных переменных в рассматриваемом уравнении, g -- число предопределенных переменных в рассматриваемом уравнении. Тогда условие порядка может быть записано в форме т+к -- h -- g > m -- 1 или к -- g > h -- 1.

Структурное уравнение называется идентифицируемым, если оно удовлетворяет условию порядка; в случае точного равенства уравнение называется точно идентифицируемым, при строгом неравенстве -- сверхидентифицируемым.

Следующим этапом является оценивание структурных параметров. Для структурных моделей, построенных на основе p-коэффициентов, оценка p ij производится не методом наименьших квадратов, а с помощью такого приема. Запишем уравнение (3) следующим образом: или иначе (9)

Используем коэффициенты корреляции между зависимой переменной и каждой из объясняющих переменных: (10)

где n- число наблюдений.

Подставляя в (10) вместо x i правую часть выражения (10), получим: (11)

В этом преобразовании учтено, что корреляция u i , с х j по определению равна нулю. Если учесть, что r ij =1, то соотношение (11), называемое основной теоремой путевого анализа, можно записать так: (12)

Здесь j указывает на объясняющую переменную, связь которой с объясняемой переменной i раскрывается в структурной модели, к пробегает по подмножеству всех переменных, непосредственно влияющих на i-ю переменную (на графе эти вершины связаны с вершиной i дугами). Соотношение (12) справедливо для любой рекурсивной системы.

Путевой анализ позволяет произвести декомпозицию корреляции r ij . Введем понятия «полная (совокупная) связь», «совокупное влияние», «прямое влияние», «косвенное влияние». Если коэффициент корреляции нулевого порядка r ij рассматривать как измеритель полной связи двух переменных, то мерой совокупного влияния j-й переменной на i-ю переменную (q ij) будет являться ее часть, не зависящая ни от общих для них переменных -- причин, ни от корреляции между общими для j-й и i-й переменных причинами (компоненты ложной корреляции), ни от наличия не анализируемой в модели априорной корреляции предопределенных переменных -- входов.

Таким образом, мы можем разложить полную связь двух переменных на четыре составляющие с учетом постулируемой в модели асимметрии воздействия: на совокупное влияние (причинное влияние) j-й переменной на i-ю, на две компоненты, измеряющие эффект ложной корреляции, и на компоненту, еще не имеющую общепринятого названия. В свою очередь, совокупное влияние может быть разложено на две составляющие с учетом того, каким образом оно осуществляется -- непосредственно или через другие переменные.

Прямое влияние одной переменной на другую измеряется коэффициентом p ij ; в этом случае в цепи между объясняющей и объясняемой переменными нет промежуточных звеньев. Косвенное влияние -- это влияние тех составляющих совокупного влияния одной переменной на другую, которое образуется при учете эффекта передачи воздействия через посредство переменных, специфицированных в модели как промежуточные звенья в причинной цепи, связывающей изучаемые переменные. Поскольку строение совокупного влияния всецело зависит от постулируемой причинной структуры отношений между переменными, то и все введенные выше понятия имеют смысл только лишь по отношению к причинной модели с заданным графом связей.

ОСНОВНАЯ ТЕОРЕМА ФУНКЦИОНАЛЬНОГО АНАЛИЗА:

"... точно так же, как одно и то же явление может иметь мно­гочисленные функции, так и одна и та же функция может по-разному выполняться различными явлениями" .

Иначе говоря, существует диапазон вариаций (хотя и ограниченный) структур, могущих выполнять ту или иную функцию.

"Таким образом... понятию незаменимых культурных форм (институтов, стандартизированной деятельности, систем убеждений и т. д.)... необходи­мо противопоставить> понятие функциональных альтернатив, функцио­нальных эквивалентов или функциональных заменителей" .

Зв. Мертоновская стратегия функционального анализа (Кодификация функционального метода)

В процессе функционального анализа необходимо выделять:

(1) различные формы, подлежащие рассмотрению (системы и их части);


"... нельзя предполагать полную интеграцию всех обществ. Вопрос об интегра­ции общества - это вопрос эмпирического исследования, и, решая его, мы должны быть готовыми к тому, что общества обнаружат различные степени интеграции...

...Теория функционального анализа должна включать в себя требование специ­фикации той социальной единицы, которая обслуживается данной социальной функцией, равно как и признание того, что явления культуры имеют множест­во следствий..." ;

(2) различные типы влияний этих форм на эмпирически установленные "фун­
кциональные предпосылки": как функциональные, так и дисфункциональные;

"определение чисто балансового итога последствий того или иного соци­ального явления" ;

(3) процессы, благодаря которым именно эти, а не другие формы начинают су­
ществовать и оказывать влияние друг на друга и на систему в целом

= "функциональные альтернативы".

Зг. Понятие "функция"

В работе "Явные и латентные функции" Мертон проанализировал применение понятия "функция" в работах функционалистов (социологов и социальных ан­тропологов).

"С самого момента возникновения в функциональный метод в социологии проникла терминологическая путаница. Очень часто один и тот же термин используется для обозначения различных понятий, точно так же как одно и то же понятие обо­значается различными терминами" .



Мертон выделяет пять значений понятия "функция" (существующих наряду со множеством других).

(1) Общественное мероприятие .

"Обиходное употребление, согласно которому функцией называют неко­торое публичное собрание или праздничное мероприятие, обычно вклю­чающее какие-то церемониальные моменты" .

Это значение редко используется в социологии и "полностью чуждо функциональному анализу".

(В русском языке слово "функция" в данном значении не употребляется.)

(2) Специализированный род занятий, профессия .

Это значение часто используется экономистами для описания функцио­нального распределения занятий в группе (распределения экономиче­ских функций).

Для социологии в данном случае лучше пользоваться термином "профес­сия" (или "род занятий").


(3) Должность .

<Частный случай второго значениям

"Деятельность, входящая в круг обязанностей человека, занимающего некоторое социальное положение, или, более конкретно.., круг обязанно­стей, связанных с некоторой должностью или политической позицией" .



// Отсюда слово "функционер".

Это понимание функции лучше исключить, "так как оно отвлекает наше понимание от того обстоятельства, что функции осуществляются не только лицами.., но и широким кругом стандартизированных деятельно-стей, социальных процессов, культурных стандартов и систем верова­ний..." .

(4) Математическая функция .

"...Переменная, рассматриваемая в отношении к одной или большему числу других переменных, через которые она может быть выражена и от значения которых зависит ее собственное значение" .

// Выражения: "функциональная зависимость", "функциональное отношение"...

В социологии это значение используется,

однако "... исследователи... нередко мечутся между математическим и другим, связанным, хотя и отличным от него, значением, которое также включает в себя понятия взаимозависимости, взаимного отношения или же взаимосвязанных изменений" .

(5) Взаимозависимость, взаимная связь .

Системообразующий принцип связи структурных элементов.

"...Именно это пятое значение слова и является главным в функциональ­ном анализе в том его виде, в котором он применяется в социологии и социальной антропологии" .

(Это значение заимствовано из биологии.) Функция описывалась как:

Роль в обществе;

Вклад в сохранение общества в целом; способ взаимосвязи элементов внутри системы.

Использование в качестве синонимов-эквивалентов таких понятий, как "при­менение", "полезность", "цель", "мотив", "намерение", "стремление", "следствие" и т. п., вносит путаницу в понятийный аппарат и, кроме того, часто ведет к сме­шению (субъективных) мотивов с (объективной) функцией.

Следовательно , в целях систематизации понятий функционального анализа необходимо четко разделить понятия мотивов и функций.


Мертон дает термину "функция" следующее ОПРЕДЕЛЕНИЕ:

"функции - это те наблюдаемые последствия, которые способствуют адаптации или приспособлению данной системы" .

Зд. Понятия "дисфункция" и "социологическая амбивалентность"

ОПРЕДЕЛЕНИЕ.

"Дисфункции - это те наблюдаемые последствия, которые уменьша­ют приспособление или адаптацию системы" .

Понятие "дисфункция" указывает на наличие напряжения, принужде­ния, давления на структурном уровне.

Позднее, продолжая свою линию на выявление как положительных, так и отри­цательных последствий того или иного явления для системы, Мертон ввел по­нятие "социологическая амбивалентность". Суть этого понятия в том, что любая форма, выполняющая (или способная выполнять) позитивные функции в сис­теме, способна играть (или играет) в ней также и дисфункциональную роль.

Зе. Явные и латентные функции (Работа "Явные и латентные функции", с.425-431)

ЦЕЛЬ ВВЕДЕНИЯ ДАННОГО РАЗГРАНИЧЕНИЯ -

исключить смешение сознательной (субъективной) мотивации социально­го поведения и его объективных последствий.

СУТЬ РАЗГРАНИЧЕНИЯ:

"разграничение между случаями, в которых субъективные цели совпадают с объективными последствиями, и случаями, когда они расходятся" . "В основе разграничения между явными и латентными функциями лежит сле­дующее: первые относятся к тем объективным и преднамеренным последст­виям социального действия, которые способствуют приспособлению или адаптации некоторой определенной социальной единицы (индивидуум, под­группа, социальная или культурная система); вторые относятся к непредна­меренным и неосознанным последствиям того же самого порядка" .


ОПРЕДЕЛЕНИЕ.


"Явные функции - это те объективные последствия, ко­торые вносят свой вклад в регулирование или приспособ­ление системы и которые входили в намерения и осозна­вались участниками системы.

Латентные функции, соответственно, - те объективные
последствия, которые не входили в намерения и не были
осознаны" . ________________________________

ЭВРИСТИЧЕСКИЕ ЦЕЛИ РАЗГРАНИЧЕНИЯ.

(1) "Это разграничение позволяет понять стандарты социального поведения,
которые на первый взгляд кажутся иррациональными" .

Например, предрассудки, суеверия, инертные традиции - это формы по­ведения, продолжающие существовать, в то время как их явные цели уже не осуществляются.

"Это поведение может выполнять функцию для группы, со­вершенно отличную от явной ее цели... *" Путем систематического применения понятия латентной функции иногда можно обнаружить, что явно иррациональ­ное поведение является положительно функциональным для группы" .

(2) "Однако в тех случаях, когда социальное поведение не направляется на
достижение явно недосягаемых целей, исследование побочных или ла­
тентных функций поведения социологами становится менее вероятным.

Различение между явными и латентными функциями направляет вни­мание на теоретически плодотворные области исследования" .

Вопрос : достигает ли принятая практика поставленной перед ней цели? (Особенно важны ответы на такого рода вопросы для прак­тической политики.)

Изучение латентных функций наиболее многообещающе для теоретической социологии:

(3) оно позволяет избежать моральных оценок;

(4) оно делает социологию не просто регистрацией наблюдаемых и очевидных для здравого смысла данных; оно выводит ее за рамки обыденного созна­ния, для которого латентные функции социальных явлений (по определе­нию) недоступны.

Зж. Парадигма для функционального анализа в социологии: 11 положений (Работа "Явные и латентные функции", с.412-425)

Социологии необходима общая "логика процедуры" для проведения исследо­вания.

"В качестве первого опытного шага в направлении кодификации функционального анализа в социологии предлагается парадигма понятий и проблем, которые явля­ются центральными для данного подхода.., «Эна> позволяет одновременно рас­сматривать основные требования функционального анализа и помогает исследо­вателю вносить коррективы в выдвигаемые им интерпретации... Данная парадиг­ма дает нам основное ядро понятий, методик и выводов функционального анализа" .

1. Явление (явления), которому приписывается функция .

Объект анализа должен представлять собой "стандартизированное (т. е. типизированное, повторяющееся) явление, такое, как социальные роли, ин-


ституционные типы, социальные процессы, культурные стандарты, эмоцио­нальные реакции, выраженные в соответствии с нормами данной культуры, социальные нормы, групповые организации, социальные структуры, средства социального контроля и т. д." .

2. Субъективные предпосылки (мотивы, цели) -

"мотивы деятельности индивидов, включенных в исследуемую систему" (не путать с объективными последствиями мотиваций).

3. Объективные последствия (функции, дисфункции).

(1) Необходимость учета множественности последствий = требование под­
ведения "чистого балансового итога совокупных последствий":

(а) функции;

(б) дисфункции;

(в) нефункциональные последствия, безразличные для сис­
темы.

(2) Разграничение объективных функций и субъективных мотивов:

(а) явные функции;

(б) латентные функции.

4. Социальная единица, обслуживаемая функцией .
Необходимо рассматривать последствия явления для:

Индивидов разного статуса;

Подгрупп;

Больших социальных и культурных систем.

5. Функциональные требования (потребности, предпосылки существования).

Проблема установления разных типов функциональных предпосылок (все­общие versus специфические).

6. Механизмы, через которые выполняется функция .
Социальные
(не психологические) механизмы:

Распределение ролей;

Иерархический порядок ценностей;

Обособление институциональных требований;

Социальное разделение труда;

Ритуалы, церемонии; и т. д.

7. Функциональные альтернативы (эквиваленты, заменители).

«Этказ от постулата функциональной неизбежности и не­заменимости конкретных социальных структур>.

Проблема "определения диапазона изменчивости явлений, оставаясь в ко­тором, они могут выполнять определенную функцию".

8. Структурный контекст (ограничивающее влияние структуры).

"Диапазон вариаций в явлениях, при которых они могут выполнять соответ­ствующие функции в социальной структуре, не является беспредельным.


Взаимозависимость элементов социальной структуры ограничивает факти­ческие возможности изменений или функциональных альтернатив" .

9. Динамика и изменение .

Необходимо исследовать как статические, так и динамические аспекты соци­альной структуры. (Особая роль изучения дисфункций.) Исследование фак­торов неравновесия.

10. Проблемы, связанные с установлением достоверности положений функ-
иионального анализа
.

(Требование строгих методик анализа; связь с практическими исследова­ниями.)

11. Проблемы идеологического значения функционального анализа .

Роль идеологии (влияние заказчика) в постановке проблем, формули­ровке гипотез, понятий, выводов;

Возможное идеологическое значение выводов.

§ 5. Основная теорема анализа

1. Основная теорема. Понятие об интегрировании, и в некоторой мере о дифференцировании, было хорошо развито раньше работ Ньютона и Лейбница. Но было совершенно необходимо сделать одно очень простое открытие, для того чтобы дать толчок к огромной эволюции вновь созданного математического анализа. Два как будто бы взаимно не соприкасающихся предельных процесса, употребляемые один для дифференцирования, другой для интегрирования функций, оказались тесно связанными между собой. В самом деле, они являются взаимно

обратными операциями, по-

добно таким операциям, как

сложение и вычитание, умно-

жение и деление. Дифферен-

циальное и интегральное ис-

числения представляют собой

нечто единое.

Великое достижение Нью-

тона и Лейбница заключается

в том, что они впервые яс-

Рис. 274. Интеграл как функция верхнего

но осознали и использовали

эту основную теорему анали-

за. Без сомнения, их откры-

тие лежало на прямом пути естес твенного научного развития, и нисколько не удивительно, что различ ные лица пришли независимо и почти одновременно к ясному пониманию указанного выше обстоятельства.

Для того чтобы точно сформулировать основную теорему, рассмотрим интеграл от функции y = f(x) в пределах от постоянного числа a до числа x, которое будем считать переменным. Чтобы не смешивать верхнего предела интегрирования x с переменной, фигурирующей под знаком интеграла, запишем интеграл в следующем виде (см. стр. 428 ):

F (x) = Z

демонстрируя таким образом наше намерение изучать интеграл как функцию F (x) своего верхнего предела (рис. 274). Эта функция F (x) есть площадь под кривой y = f(u) от точки u = a до точки u = x. Иногда интеграл F (x) с переменным верхним пределом называют «неопределенным интегралом».

Основная теорема анализа читается следующим образом:

Производная неопределенного интеграла (1 ) по его верхнему пределу x равна значению функции f(u) в точке u = x:

F 0 (x) = f(x).

ОСНОВНАЯ ТЕОРЕМА АНАЛИЗА

Другими словами, процесс интегрирования, ведущий от функции f(x) к функции F (x), «уничтожается» обратным ему процессом дифференцирования, применяемым к функции F (x).

На интуитивной основе доказательство этого предложения не представляет труда. Оно базируется на интерпретации интеграла F (x) как площади, и было бы затемнено, если бы мы попытались представлять функцию F (x) в виде графика и истолковывать производную F 0 (x) как соответствующий наклон. Оставляя в стороне установленную ранее геометрическую интерпретацию производной, мы сохраним геометрическое толкование интеграла F (x) как площади, а дифференцировать функцию F (x) станем аналитическим методом. Разность

F (x1 ) − F (x)

есть просто площадь под кривой y = f(u) между пределами u = x1 и u = x (рис. 275), и нетрудно понять, что числовое значение этой площади заключено между числами (x1 − x)m и (x1 − x)M:

(x1 − x)m 6 F (x1 ) − F (x) 6 (x1 − x)M,

где M и m являются, соответственно, наибольшим и наименьшим значениями функции f(u) в промежутке от u = x до u = x1 . Действительно, эти произведения дают площади двух прямоугольников, из которых один содержит рассматриваемую криволинейную область, а другой содержится в ней.

Рис. 275. К доказательству основной теоремы

Отсюда следует

m 6 F (x1 ) − F (x) 6 M. x1 − x

Предположим, что функция f(u) непрерывна, так что при стремлении x1 к x обе величины M и m стремятся к значению функции f(u) в точке u = x, т. е. к значению f(x). В таком случае можно считать

468 МАТЕМАТИЧЕСКИЙ АНАЛИЗ гл. VIII

доказанным, что

F 0 (x) = lim

F (x1 ) − F (x)

x1 →x

x1 − x

Интуитивный смысл этого результата заключается в том, что при возрастании скорость изменения площади под кривой y = f(x) равна высоте кривой в точке x.

В некоторых руководствах содержание этой основной теоремы затемняется вследствие неудачно выбранной терминологии. Именно, многие авторы сначала вводят понятие производной, а затем определяют «неопределенный интеграл» просто как результат операции, обратной по отношению к дифференцированию: они говорят, что функция G(x) есть неопределенный интеграл от функции f(x), если

G0 (x) = f(x).

Таким образом, этот способ изложения непосредственно связывает дифференцирование со словом «интеграл». Только позднее вводится понятие «определенный интеграл», трактуемое как площадь или как предел последовательности сумм, причем недостаточно подчеркивается, что слово «интеграл» обозначает теперь нечто совершенно другое, чем прежде. И вот оказывается, что самое главное, что содержится в теории, приобретается лишь украдкой - через заднюю дверь, и учащийся встречается с серьезными затруднениями в своих усилиях понять существо дела. Мы предпочитаем функции G(x), для которых G0 (x) = f(x), называть не «неопределенными интегралами», а первообразными функциями от функции f(x). Тогда основная теорема может быть сформулирована следующим образом:

Функция F (x), являющаяся интегралом от функции f(x) при постоянном нижнем и переменном верхнем пределе x, есть одна из первообразных функций от функции f(x).

Мы говорим «одна из» первообразных функций по той причине, что если G(x) является первообразной функцией от f(x), то непосредственно ясно, что и любая функция вида H(x) = G(x) + c (c - произвольная постоянная) есть также первообразная, так как H0 (x) = G0 (x). Обратное утверждение также справедливо. Две первообразные функции G(x)

и H(x) могут отличаться одна от другой не иначе, как постоянным слагаемым. Действительно, разность U(x) = G(x) − H(x) имеет в качестве производной U0 (x) = G0 (x) − H0 (x) = f(x) − f(x) = 0, т. е. эта разность постоянна, так как очевидно, что если график функции в каждой своей точке горизонтален, то сама функция, представляемая графиком, непременно должна быть постоянной.

Это ведет к очень важному правилу вычисления интеграла в пределах от a до b - в предположении, что нам известна какая-либо первообразная функция G(x) от функции f(x). Согласно нашей основной

ОСНОВНАЯ ТЕОРЕМА АНАЛИЗА

теореме, функция

есть также первообразная функция от функции f(x). Значит, F (x) =

G(x) + c, где c - постоянная. Значение этой постоянной определится,

если мы примем во внимание, что F (a) = f(u) du = 0. Отсюда следует:

0 = G(a) + c, так что c = −G(a). Тогда определенный интеграл в пределах от a до x тождественно удовлетворяет равенству

F (x) = f(u) du = G(x) − G(a);

замена x через b приводит к формуле

f(u) du = G(b) − G(a),

независимо от того, какая именно из первообразных функций была «пущена в ход». Другими словами: чтобы вычислить определенный ин-

теграл f(x) dx, достаточно найти такую функцию G(x), для кото-

рой G0 (x) = f(x), и затем составить разность G(b) − G(a).

2. Первые применения. Интегрирование функций xr , cos x, sin x. Функция arctg x. Здесь невозможно дать исчерпывающее представление о роли основной теоремы, и мы ограничимся тем, что приведем несколько выразительных примеров. В задачах, встречающихся в механике и физике или в самой математике, очень часто приходится подсчитывать числовое значение некоторого определенного интеграла. Прямая попытка найти интеграл как предел может быть непреодолимо трудной. С другой же стороны, как мы это видели в § 3, любое дифференцирование выполняется сравнительно легко, и без труда возможно накопить очень большое количество формул дифференцирования. Каждая такая формула G0 (x) = f(x), обратно, может быть рассматриваема как формула, определяющая первообразную функцию G(x) от функции f(x).

Формула (3 ) позволяет использовать известную первообразную функцию для вычисления интеграла от функции f(x) в некотором данном промежутке.

Если мы, например, хотим найти интегралы от степеней x2 , x3 , или в общем виде xn , то самое простое - это действовать, как указано в § 1. По формуле дифференцирования степени производная от xn равна nxn−1 ,

470 МАТЕМАТИЧЕСКИЙ АНАЛИЗ гл. VIII

так что производная от функции

G(x) = n x

1 (n 6= −1)

есть функция

G0 (x) = n n + + 1 1 xn = xn .

x n+1

В таком случае функция n + 1 является первообразной функцией

по отношению к функции f(x) = xn , а следовательно, мы немедленно получаем формулу

x n dx = G(b) − G(a) = b n+1 − a n+1 . n + 1

Это рассуждение несравненно проще громоздкой процедуры непосредственного вычисления интеграла как предела суммы.

Как более общий случай, мы нашли в § 3, что при любом рациональном s, как положительном, так и отрицательном, производная функции xs равна sxs−1 , а потому при s = r + 1 функция

x r+1

имеет производную f(x) = G0 (x) = xr (мы предполагаем, что r 6= −1,

x r+1

т. е. что s 6= 0). Итак, функция r + 1 есть первообразная функция, или

«неопределенный интеграл» от xr , и мы получаем (при положительных a и b и при r 6= −1) формулу

xr dx =

b r+1 − a r+1

В формуле (4 ) приходится предполагать, что стоящая под интегралом функция xr определена и непрерывна в промежутке интегрирования, так что нужно исключить точку x = 0, если r < 0. Вот потому мы и вынуждены допустить, что в этом случае a и b положительны.

Если положим G(x) = − cos x, то получим G0 (x) = sin x, и отсюда возникает соотношение

sin xdx = −(cos a − cos 0) = 1 − cos a.

Аналогично, если G(x) = sin x, то G0 (x) = cos x, и значит,

cos xdx = sin a − sin 0 = sin a.

§ 5 ОСНОВНАЯ ТЕОРЕМА АНАЛИЗА 471

Особенно интересный результат получается из формулы дифференцирования функции arctg x:

Раз функция arctg x есть первообразная по отношению к функции

1 + x2

то на основании формулы (3 ) можно написать

arctg b − arctg 0 = Z 0

1 + x2 dx.

Но arctg 0 = 0 (нулевому значению тангенса соответствует нулевое значение угла). Итак, мы имеем

arctg b = Z 0

1 + x2

В частности,

значению

тангенса,

1, соответствует

в 45◦ , что в радианной мере со-

ставляет p . Таким образом, мы

получаем

замечательную

1 + x2 dx.

показывает,

что площадь

графиком

1 + x 2 в пределах от x = 0 до x =

1 равна четверти площади еди-

276. Площадь под кри-

ничного круга.

в пределах

3. Формула

Лейбница

1 + x2

приводит

для p . Последний результат

из красивейших

математических формул, открытых в XVII в., - к знакоп еременному

ряду Лейбница, позволяющему вычислять p:

4 p = 1 1 − 3 1 + 5 1 − 7 1 + 9 1 − 11 1 + . . .

Символ + . . . следует понимать в том смысле, что последовательность конечных «частных сумм», получающихся, когда в правой части ра-

венств берется лишь n членов суммы, стремится к пределу p при

неограниченном возрастании n.

МАТЕМАТИЧЕСКИЙ АНАЛИЗ

Чтобы доказать эту замечательную формулу, нам достаточно вспомнить формулу суммы конечной геометрической прогрессии

1 − q n = 1 + q + q2 + . . . + qn−1 ,

где «остаточный член» Rn выражается формулой

Rn = (−1)n x 2n 2 .

Равенство (8 ) можно проинтегрировать в пределах от 0 до 1. Следуя правилу a) из § 3, мы должны взять в правой части сумму интегралов от отдельных слагаемых. На основании (4 ) мы знаем, что

xm dx =

b m+1

− am+1

частности, получим

xm dx =

откуда, в

1 + x2

1 − 3 +

А следовательно,

− 7

+ . . . + (−1)n−1

2n − 1 + T n ,

p · R 0

1 + x2

Tn = (

Согласно формуле (5 ), левая часть форму-

лы (9 ) равна

Разность между

и частной суммой

(−1)n−1

Sn = 1 −

− Sn = Tn . Остается доказать, что Tn стремится к нулю при

возрастании n. Мы имеем неравенство

x 2n 6 x2n .

1 + x2

Вспомнив формулу (13 ) § 1, устанавливающую неравенство

f(x) dx 6 g(x) dx при f(x) 6 g(x) и a < b,