- Введение
- Возможности решателя scipy.optimize.root для численного решения систем алгебраических нелинейных уравнений
- Методы решения систем нелинейных уравнений
- Выбор модельной функции
- Программа для тестирования на модельной функции c результатами решения системы алгебраических нелинейных уравнений с помощью библиотечной функции optimize.root для разных методов отыскания корней
- Программа для тестирования на модельной функции c результатами решения системы алгебраических нелинейных уравнений с помощью программы написанной на Python 3 с учётом соотношений (1)-(8) для отыскания корней по модифицированному методу Ньютона
- Нелинейные системы и уравнения
- Метод Ньютона
- Решение нелинейных уравнений
- Решение нелинейных систем
- Решение уравнения методом ньютона на питоне
- 📸 Видео
Введение
Многие прикладные задачи приводят к необходимости нахождения общего решения системы нелинейных уравнений. Общего аналитического решения системы нелинейных уравнений не найдено. Существуют лишь численные методы.
Следует отметить интересный факт о том, что любая система уравнений над действительными числами может быть представлена одним равносильным уравнением, если взять все уравнения в форме , возвести их в квадрат и сложить.
Для численного решения применяются итерационные методы последовательных приближений (простой итерации) и метод Ньютона в различных модификациях. Итерационные процессы естественным образом обобщаются на случай системы нелинейных уравнений вида:
(1)
Обозначим через вектор неизвестных и определим вектор-функцию Тогда система (1) записывается в виде уравнения:
(2)
Теперь вернёмся к всеми любимому Python и отметим его первенство среди языков программирования, которые хотят изучать [1].
Этот факт является дополнительным стимулом рассмотрения числительных методов именно на Python. Однако, среди любителей Python бытует мнение, что специальные библиотечные функции, такие как scipy.optimize.root, spsolve_trianular, newton_krylov, являются самым лучшим выбором для решения задач численными методами.
С этим трудно не согласится хотя бы потому, что в том числе и разнообразие модулей подняло Python на вершину популярности. Однако, существуют случаи, когда даже при поверхностном рассмотрении использование прямых известных методов без применения специальных функций библиотеки SciPy тоже дают неплохие результаты. Иными словами, новое- это хорошо забытое старое.
Так, в публикации [2], на основании проведенных вычислительных экспериментов, доказано, что библиотечная функция newton_krylov, предназначенная для решения больших систем нелинейных уравнений, имеет в два раза меньшее быстродействие, чем алгоритм TSLS+WD
(two-step least squares), реализованный средствами библиотеки NumPy.
Целью настоящей публикации является сравнение по числу итераций, быстродействию, а главное, по результату решения модельной задачи в виде системы из ста нелинейных алгебраических уравнений при помощи библиотечной функции scipy.optimize.root и методом Ньютона, реализованного средствами библиотеки NumPy.
Возможности решателя scipy.optimize.root для численного решения систем алгебраических нелинейных уравнений
Библиотечная функция scipy.optimize.root выбрана в качестве базы сравнения, потому что имеет обширную библиотеку методов, пригодных для сравнительного анализа.
scipy.optimize.root(fun, x0, args=(), method=’hybr’, jac=None, tol=None,callback=None, ptions=None)
fun — Векторная функция для поиска корня.
x0 –Начальные условия поиска корней
method:
hybr -используется модификация Пауэлл гибридный метод;
lm – решает системы нелинейных уравнений методом наименьших квадратов.
Как следует из документации [3] методы broyden1, broyden2, anderson, linearmixing, diagbroyden, excitingmixing, krylov являются точными методами Ньютона. Остальные параметры являются «не обязательными» и с ними можно ознакомится в документации.
Методы решения систем нелинейных уравнений
Приведенный далее материал действительно можно прочитать в литературе, например в [4], но я уважаю своего читателя и для его удобства приведу вывод метода по возможности в сокращенном виде. Те, кто не любит формулы, этот раздел пропускают.
В методе Ньютона новое приближение для решения системы уравнений (2) определяется из решения системы линейных уравнений:
(3)
Определим матрицу Якоби:
(4)
Запишем(3) в виде:
(5)
Многие одношаговые методы для приближенного решения (2) по аналогии с двухслойными итерационными методами для решения систем линейных алгебраических уравнений можно записать в виде:
(6)
где — итерационные параметры, a — квадратная матрица n х n, имеющая обратную.
При использовании записи (6) метод Ньютона (5) соответствует выбору:
Система линейных уравнений (5) для нахождения нового приближения может решаться итерационно. В этом случае мы имеем двухступенчатый итерационный процесс с внешними и внутренними итерациями. Например, внешний итерационный процесс может осуществляться по методу Ньютона, а внутренние итерации — на основе итерационного метода Зейделя
При решении систем нелинейных уравнений можно использовать прямые аналоги стандартных итерационных методов, которые применяются для решения систем линейных уравнений. Нелинейный метод Зейделя применительно к решению (2) дает:
(7)
В этом случае каждую компоненту нового приближения из решения нелинейного уравнения, можно получить на основе метода простой итерации и метода Ньютона в различных модификациях. Тем самым снова приходим к двухступенчатому итерационному методу, в котором внешние итерации проводятся в соответствии с методом Зейделя, а внутренние — с методом Ньютона.
Основные вычислительные сложности применения метода Ньютона для приближенного решения систем нелинейных уравнений связаны с необходимостью решения линейной системы уравнений с матрицей Якоби на каждой итерации, причем от итерации к итерации эта матрица меняется. В модифицированном методе Ньютона матрица Якоби обращается только один раз:
(8)
Выбор модельной функции
Такой выбор не является простой задачей, поскольку при увеличении числа уравнений в системе в соответствии с ростом числа переменных результат решения не должен меняться, поскольку в противном случае невозможно отследить правильность решения системы уравнений при сравнении двух методов. Привожу следующее решение для модельной функции:
Функция f создаёт систему из n нелинейных уравнений, решение которой не зависит от числа уравнений и для каждой из n переменных равно единице.
Программа для тестирования на модельной функции c результатами решения системы алгебраических нелинейных уравнений с помощью библиотечной функции optimize.root для разных методов отыскания корней
Только один из методов, приведенных в документации [3] прошёл тестирование по результату решения модельной функции, это метод ‘krylov’.
Решение для n=100:
Solution:
[1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1.]
Krylov method iteration = 4219
Optimize root time 7.239 seconds:
Вывод: С увеличением числа уравнений вдвое заметно появление ошибок в решении. При дальнейшем увеличении n решение становится не приемлемым, что возможно из-за автоматической адаптации к шагу, эта же причина резкого падения быстродействия. Но это только моё предположение.
Программа для тестирования на модельной функции c результатами решения системы алгебраических нелинейных уравнений с помощью программы написанной на Python 3 с учётом соотношений (1)-(8) для отыскания корней по модифицированному методу Ньютона
Решение для n=100:
Solution:
[1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1.]
Newton iteration = 13
Newton method time 0.496 seconds
Решение для n=200:
Solution:
[1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
1. 1. 1. 1. 1. 1. 1. 1.]
Newton iteration = 14
Newton method time 1.869 seconds
Чтобы убедиться в том, что программа действительно решает систему, перепишем модельную функцию для ухода от корня со значением 1 в виде:
Получим:
Solution:
[ 0.96472166 0.87777036 0.48175823 -0.26190496 -0.63693762 0.49232062
-1.31649896 0.6865098 0.89609091 0.98509235]
Newton iteration = 16
Newton method time 0.046 seconds
Вывод: Программа работает и при изменении модельной функции.
Теперь вернёмся к начальной модельной функции и проверим более широкий диапазон для n, например в 2 и 500.
n=2
Solution:
[1. 1.]
Newton iteration = 6
Newton method time 0.048 seconds
n=500
Видео:Решение нелинейного уравнения методом Ньютона (касательных) (программа)Скачать
Нелинейные системы и уравнения
В более общем случае мы имеем не одно уравнение (1), а систему нелинейных уравнений $$ begin tag f_i(x_1, x_2, ldots, x_n) = 0, quad i = 1, 2, ldots n. end $$ Обозначим через ( mathbf = (x_1, x_2, ldots, x_n) ) вектор неизвестных и определим вектор-функцию ( mathbf(mathbf) = (f_1(mathbf), f_2(mathbf), ldots, f_n(mathbf)) ). Тогда система (2) записывается в виде $$ begin tag mathbf(mathbf) = 0. end $$ Частным случаем (3) является уравнение (1) (( n = 1 )). Второй пример (3) — система линейных алгебраических уравнений, когда ( mathbf (mathbf) = A mathbf — mathbf ).
Видео:Метод Ньютона (метод касательных) Пример РешенияСкачать
Метод Ньютона
Видео:Вычислительная математика. Метод касательных на Python(1 практика).Скачать
Решение нелинейных уравнений
При итерационном решении уравнений (1), (3) задается некоторое начальное приближение, достаточно близкое к искомому решению ( x^* ). В одношаговых итерационных методах новое приближение ( x_ ) определяется по предыдущему приближению ( x_k ). Говорят, что итерационный метод сходится с линейной скоростью, если ( x_ — x^* = O(x_k — x^*) ) и итерационный метод имеет квадратичную сходимость, если ( x_ — x^* = O(x_k — x^*)^2 ).
В итерационном методе Ньютона (методе касательных) для нового приближения имеем $$ begin tag x_ = x_k + frac, quad k = 0, 1, ldots, end $$
Вычисления по (4) проводятся до тех пор, пока ( f(x_k) ) не станет близким к нулю. Более точно, до тех пор, пока ( |f_(x_k)| > varepsilon ), где ( varepsilon ) — малая величина.
Простейшая реализация метода Ньютона может выглядеть следующим образом:
Чтобы найти корень уравнения ( x^2 = 9 ) необходимо реализовать функции
Данная функция хорошо работает для приведенного примера. Однако, в общем случае могут возникать некоторые ошибки, которые нужно отлавливать. Например: пусть нужно решить уравнение ( tanh(x) = 0 ), точное решение которого ( x = 0 ). Если ( |x_0| leq 1.08 ), то метод сходится за шесть итераций.
Теперь зададим ( x_0 ) близким к ( 1.09 ). Возникнет переполнение
Возникнет деление на ноль, так как для ( x_7 = -126055892892.66042 ) значение ( tanh(x_7) ) при машинном округлении равно ( 1.0 ) и поэтому ( f^prime(x_7) = 1 — tanh(x_7)^2 ) становится равной нулю в знаменателе.
Проблема заключается в том, что при таком начальном приближении метод Ньютона расходится.
Еще один недостаток функции naive_Newton заключается в том, что функция f(x) вызывается в два раза больше, чем необходимо.
Учитывая выше сказанное реализуем функцию с учетом следующего:
- обрабатывать деление на ноль
- задавать максимальное число итераций в случае расходимости метода
- убрать лишний вызов функции f(x)
Метод Ньютона сходится быстро, если начальное приближение близко к решению. Выбор начального приближение влияет не только на скорость сходимости, но и на сходимость вообще. Т.е. при неправильном выборе начального приближения метод Ньютона может расходиться. Неплохой стратегией в случае, когда начальное приближение далеко от точного решения, может быть использование нескольких итераций по методу бисекций, а затем использовать метод Ньютона.
При реализации метода Ньютона нужно знать аналитическое выражение для производной ( f^prime(x) ). Python содержит пакет SymPy, который можно использовать для создания функции dfdx . Для нашей задачи это можно реализовать следующим образом:
Видео:Алгоритмы С#. Метод Ньютона для решения систем уравненийСкачать
Решение нелинейных систем
Идея метода Ньютона для приближенного решения системы (2) заключается в следующем: имея некоторое приближение ( pmb^ ), мы находим следующее приближение ( pmb^ ), аппроксимируя ( pmb(pmb^) ) линейным оператором и решая систему линейных алгебраических уравнений. Аппроксимируем нелинейную задачу ( pmb(pmb^) = 0 ) линейной $$ begin tag pmb(pmb^) + pmb(pmb^)(pmb^ — pmb^) = 0, end $$ где ( pmb(pmb^) ) — матрица Якоби (якобиан): $$ pmb(pmb^) = begin frac<partial f_1(pmb^)> & frac<partial f_1(pmb^)> & ldots & frac<partial f_1(pmb^)> \ frac<partial f_2(pmb^)> & frac<partial f_2(pmb^)> & ldots & frac<partial f_2(pmb^)> \ vdots & vdots & ldots & vdots \ frac<partial f_n(pmb^)> & frac<partial f_n(pmb^)> & ldots & frac<partial f_n(pmb^)> \ end $$ Уравнение (5) является линейной системой с матрицей коэффициентов ( pmb ) и вектором правой части ( -pmb(pmb^) ). Систему можно переписать в виде $$ pmb(pmb^)pmb = — pmb(pmb^), $$ где ( pmb = pmb^ — pmb^ ).
Таким образом, ( k )-я итерация метода Ньютона состоит из двух стадий:
1. Решается система линейных уравнений (СЛАУ) ( pmb(pmb^)pmb = -pmb(pmb^) ) относительно ( pmb ).
2. Находится значение вектора на следующей итерации ( pmb^ = pmb^ + pmb ).
Для решения СЛАУ можно использовать приближенные методы. Можно также использовать метод Гаусса. Пакет numpy содержит модуль linalg , основанный на известной библиотеке LAPACK, в которой реализованы методы линейной алгебры. Инструкция x = numpy.linalg.solve(A, b) решает систему ( Ax = b ) методом Гаусса, реализованным в библиотеке LAPACK.
Когда система нелинейных уравнений возникает при решении задач для нелинейных уравнений в частных производных, матрица Якоби часто бывает разреженной. В этом случае целесообразно использовать специальные методы для разреженных матриц или итерационные методы.
Можно также воспользоваться методами, реализованными для систем линейных уравнений.
Видео:Метод касательных (метод Ньютона)Скачать
Решение уравнения методом ньютона на питоне
Для выборки вида:
линейная регрессия не подходит
Модель для выборки подбирает эксперт. Данная выборка похожа на синус
Запишем МНК
Запустим алгоритм на нашей выборке; Минимизируем градиентным спуском.
код программы non_linear_stanrard.py
Можно мин-ть градиентным спуском. Но есть метод Ньютона, алгоритм Ньютона (также известный как метод касательных) — это итерационный численный метод нахождения корня (нуля) заданной функции. Подробно метод описан здесь Применим его для поиска экстремума нашей функции.
Пусть необходимо найти минимум функции многих переменных Эта задача равносильна задаче нахождения нуля градиента
Применим метод Ньютона, и запишем в удобном итеративном виде (Н — гессиан, матрица Гёссе):
Следует отметить, что в случае квадратичной функции метод Ньютона находит экстремум за одну итерацию. Сходится с квадратичной скоростью, но функция должна быть выпукла.
Метод Ньютона — Рафсона является улучшением метода Ньютона нахождения экстремума, описанного выше. Основное отличие заключается в том, что на очередной итерации каким-либо из методов одномерной оптимизации выбирается оптимальный шаг:
Реализуем метод Ньютона-Рафсона
Для нахождения матрицы Гёссе, запишем нашу функцию так:
Посчитаем матрицу Гессе вторых производных сначала в общем виде: по первой производной по второй производной
Эту часть вычислим в математике
Реализуем Hessian(полученные формулы) на python
Теперь сделаем нужный спуск, не забудем про лямбду (длину вектора)
Лямбду найдем методом золотого сечения, в программме — Golden, принимает функцию (функционал качества), границы, эпсилон и кол-во итераций
код программы в non_linear_hessian.py
Вот как отработают оба алгоритма: Градиентный спуск с шагом 0.002 и Метод Ньютона — Рафсона. Мы видим, что оба сошлись к одному результату. По скорости, Метод Ньютона — Рафсона гораздо быстрее.
Сравним ошибки. Мы видимЮ что у Ньютона — Рафсона SSE меньше и он быстрее сходится.
С применением метода Ньютона — Рафсона, функция сходится в разы быстрее (сошелся за 3 итерации в данном примере), при этом квадратичная ошибка не ухудшается.
Можно также заметить, что стандартный метод Ньютона (без лямбды) не всегда сходится. На данном примере, при начальном x0 = (1,1,1,1) метод не сошелся
📸 Видео
Метод Ньютона | Лучший момент из фильма Двадцать одно 21Скачать
Решение 1 го нелинейного алгебраического уравнения в PythonСкачать
Решение n го нелинейных алгебраических уравнений в PythonСкачать
Интерполяция в PythonСкачать
34 Задача: Найти корни квадратного уравнения при помощи PythonСкачать
Метод Ньютона (Метод касательных)Скачать
Решение системы ОДУ в PythonСкачать
Сам себе программист Изучаю Python с нуля в свои 55! Исследование операций Метод Ньютона-Рафсона.Скачать
Численные методы (1 урок)(Решение нелинейных уравнений. Метод дихотомии. Python)Скачать
Алгоритмы. Интерполяционный полином НьютонаСкачать
МЗЭ 2021 Лекция 11 Метод Ньютона для решения систем нелинейных уравненийСкачать
FreeDy010 Решение Системы нелинейных уравнений scipy sympyСкачать
Метод касательных (алгоритм Ньютона) на C#Скачать
Решения системы линейных уравнений на Python (Sympy).Скачать
Решение систем линейных матричных уравнений через формулы Крамера в PythonСкачать