Аппроксимация точек прямой. Линейная аппроксимация

Главная / Оскар Уайльд

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

НАЦИОНАЛЬНЫЙ МИНЕРАЛЬНО-СЫРЬЕВОЙ УНИВЕРСИТЕТ

«ГОРНЫЙ»

Кафедра АТПП

Математические методы обработки данных

Лабораторная работа № 2

ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ ПО МЕТОДУ ГАИМЕНЬШИХ КВАДРАТОВ

Выполнил: студент гр.АПМ-13 ____ __________ / Озеров Б.А. /

(подпись) (Ф.И.О.)

Проверил: доцент ­­­­­___________ / Иванов П.В. /

(подпись) (Ф.И.О.)

Санкт-Петербург

Цель работы: изучение практических приемов нахождения коэффициентов линейных и нелинейных регрессионных зависимостей и оценки точности аппроксимации с использованием программной среды MathCad.

Линейная аппроксимация.

Дано:

Способы аппроксимации:

line ;

2) решение системы линейных уравнений с помощью конструкции Given – Find .

Выполнение задания:

1) решение системы линейных уравнений, используя функцию line.

Делаем матрицу данных нам величин, а именно x и y. Функция line просто вычисляет быстрым способом, находит не известные коэффициенты. Получаем искомые коэффициенты. Запись в программе MathCad представлена на рис.1

рис.1 решение системы линейных уравнений, используя функцию line

в программе MathCad

2) Конструкция Given – Find использует расчетную методичку, основанную на поиске корня вблизи точки начального приближения.

В блоке Given записывается система уравнений (неравенств), подлежащих решению. Система уравнений должна быть записана после или правее Given. Перед словом Given необходимо указывать начальные приближения для всех переменных. Признаком окончания системы служит Find.

Сначала задаем матрицу данных нам величин, а именно x и y. И задаем начальное приближение А и В, от которых будем начинать искать значения линейного уравнения Ах+В=y. Затем вводим служебное слово Given и после него записываем уравнение, используя знак жирное равно. И в конце написать функцию Find с неизвестными переменными в качестве параметра. Получаем искомые коэффициенты. Запись в программе MathCad представлена на рис.2

Используя метод наименьших квадратов, мы составляем уравнения, которые записываем после слова Given:

рис.2 решение системы линейных уравнений с помощью конструкции Given – Find

в программе MathCad

Вычислили коэффициенты аппроксимирующего полинома линейного уравнения двумя разными способами. Они совпали: (а=А, b=B)

Введение

Основным инструментом для решения сложных математических задач в настоящее время являются численные методы, позволяющие свести решение задачи к выполнению конечного числа арифметических действий над числами; при этом результаты получаются в виде числовых значений. Численные методы позволяют получить лишь решение задачи с конкретными значениями параметров и исходных данных.

Многие численные методы разработаны давно, однако при вычислениях вручную они могли использоваться лишь для решения не слишком трудоемких задач. С появлением компьютеров начался период бурного развития численных методов и их внедрения в практику. Только вычислительной машине под силу выполнить за короткое время объем вычислений в миллиарды, триллионы и более операций, необходимых для решения многих современных задач.

Численный метод наряду с возможностью получения результата за приемлемое время должен обладать и ещё одним важным качеством - не вносить в вычислительный процесс значительных погрешностей.

Аппроксимация

При эмпирическом (экспериментальном) изучении функциональной зависимости одной величины от другой производят ряд измерений функции у от каждого конкретного значения аргумента х. Результаты измерений могут быть представлены графически либо в виде таблицы.

Задача заключается в аналитическом представлении функциональной зависимости y от x, описывающей результат этих экспериментов. Особенность задачи - погрешность, ошибки. В ходе эксперимента измеренные значения у i содержат случайные ошибки и ошибки измерений. Задача сводится к тому, что бы получить такую функциональную зависимость, которая складывала все ошибки - сглаживала.

Аппроксимирующую функцию y(x) выбирают из ряда стандартных и простых. Обозначим функциональную зависимость f (x i ; a 1 ; …a n). (1)

Здесь параметры a и n невозможно определить точно, они содержат в себе ошибки. Чтобы получить несмещённые и состоятельные оценки параметров a 1 ; …a n - можно воспользоваться методом наименьших квадратов.

Метод наименьших квадратов позволяет получить несмещенные несостоятельные оценки параметра a 1 ; …a n . При этом предполагается, что измерения смещения функции произведены независимо друг от друга и ошибки подчиняются закону нормального распределения вероятности.

Суть метода. Если все измерения уi ... yn произведены с одинаковой точностью, то оценки параметров a 1 ; …a n определяются из условия, чтобы сумма квадратов отклонения у i была наименьшей.

у i = у i - f (x i ; a 1 ; …a n)

S=(у i - f (x i ; a 1 ; …a n)) 2

Если параметры a 1 ; …a n входят в аппроксимирующую функцию (1) линейно, то система уравнений будет тоже линейной; в тех случаях, когда они не линейны, необходимо преобразовать функциональную зависимость.

Аппроксимация линейной функции

Задача сводится к следующему. Получен ряд значений функции y 1 , y 2 , …,y n при соответствующих значениях аргумента x 1 , x 2 , …,x n . Необходимо найти значения a и b выражения y=ax+b.

S=? (yi-f (a*xi+b)) ^2

dS/da=2*?(yi-a*xi-b)*xi

dS/db=2*?(yi-a*xi-bi)

Раскроем знак суммы:

Yi*xi-a*?xi^2-b*?xi=0

Переобозначим суммы,

где значения A, B, C, D известны из таблицы.

Определив значения a и b, мы решим поставленную задачу определения параметров выражения y=ax+b.

y: -10.29, -6.64, -6.70, -4.31, -3.26, -2.20, -0.08, 1.50, 3.81, 3.62

График полученной функции:

Аппроксимация степенной функции

Задача: Задача сводится к следующему. Получен ряд значений функции y 1 , y 2 , …,y n при соответствующих значениях аргумента x 1 , x 2 , …,x n . Необходимо найти значения a и b выражения y=ax b . Для этого прологарифмируем это выражение:

ln y = b ln x + ln a

и произведем замены:

Тогда получим знакомое выражение для прямой линии:

Выражение минимизируемой функции для этого случая примет вид:

S=? (yi-f(a*xi+b))^2

Решаем систему методом Крамера и находим параметры a и b

Данные: х: 2,4,6,8,10,12,14,16,18,20

у: 0.41, 0.19, 0.10, 0.07, 0.05, 0.04, 0.03, 0.02, 0.02, 0.02

График полученной функции:

Аппроксимация параболической функции

Задача: Задача сводится к следующему. Получен ряд значений функции y 1 , y 2 , …,y n при соответствующих значениях аргумента x 1 , x 2 , …,x n . Необходимо найти значения a и b и с выражения y=ax 2 +bx+c.

Выражение минимизируемой функции для этого случая примет вид:

S=? (yi-f(a*xi^2+b*xi+c))^2

Отыскание a и b сводится к решению системы уравнений:

Дифференцируем, чтобы найти минимумы:

dS/da=?(yi-a*xi^2-b*xi+c)*xi^2=0

dS/db=?(yi-a*xi^2-b*xi+c)*xi=0

dS/dc=?(yi-a*xi^2-b*xi+c)=0

Раскроем знак суммы:

Yi*xi^2-a*?xi^4-b*?xi^3-c*?xi^2=0

Yi-a*?xi^2-b*?xi*yi-c*N=0

Переобозначим суммы:

G - aE - bD - cC = 0

F - aD - bC - cA = 0

B - aC - bA - cN = 0

где A, B, C, D, E, F, G известны из таблицы.

Решаем систему методом Крамера и находим параметры a и b

Определив значения a и b и c, мы решим поставленную задачу определения параметров выражения y=ax 2 +bx+c.

Данные: х: 1,2,3,4,5,6,7,8,9,10

Кафедра: ________Информатики и компьютерных технологий _______________

КУРСОВАЯ РАБОТА

по дисциплине _______________ИНФОРМАТИКА __________________________

(наименование учебной дисциплины согласно учебному плану)

ЗАДАНИЕ

студенту группы МГП-12 Румянцева Н.А.

(шифр группы) (Ф.И.О.)

1. Тема работы: _Реализация численного метода средствами Microsoft Excel и с помощью средств пакета MathCAD

2. Исходные данные к работе: _Вариант № 17__________________________________

4. Перечень графического материала: _Представление результатов в виде экранных форм________________________________ ____________________________________

5. Срок сдачи законченной работы: ___01.05.2013г. ____________________________

Руководитель работы: ________ ______________ /_________/

(должность) (подпись) (Ф.И.О.)

Дата выдачи задания: __15.02.2013 г. ______________


Аннотация

Пояснительная записка представляет собой отчет о выполнении курсовой работы. В ней рассматриваются вопросы по нахождению эмпирических формул методом наименьших квадратов (МНК) посредством возможностей пакета Microsoft Excel, а также рассматривается решение данной задачи в пакете MathCAD. В работе получены уравнения различных видов с помощью аппроксимации линейной, квадратичной и экспоненциальной зависимостей. По окончании работы сделан вывод, каким методом задача решена лучше всего.

Страниц 24, таблиц 3, рисунков 14, приложений 0.

Abstract

The explanatory note represents the report on term paper performance. In it questions on a finding of empirical formulas by a method of the least squares (МНК) by means of possibilities of package Microsoft Excel are considered, and also the decision of the given problem in Turbo Pascal 7.0 is considered. In work the equations of various kinds by means of approximation linear, square-law and экспоненциальной dependences are received. Upon termination of work the conclusion is drawn, the problem is solved by what method is better.

Pages 24, tables 3, figures 14, appendixes 0.

Аннотация. 2

Введение. 4

Постановка задачи. 5

Общие сведения. 6

Линейная зависимость. 7

Нелинейная зависимость. 7

Исходные данные. 10

Расчет аппроксимаций в табличном процессоре Excel 11

Построение графиков. 17

Функция ЛИНЕЙН.. 18

Выполнение аппроксимации в программе MathCAD.. 19

Введение. 19

Линейная аппроксимация в программе MathCAD.. 21

Экспоненциальная аппроксимация в программе MathCAD.. 22

Полиномальная (квадратичная аппроксимация в программе MathCAD.. 23

Список литературы.. 24

Введение

Аппроксимация (от латинского "approximare" -"приближаться") – научный метод, суть которого состоит в замене одних, известных значений, другими, приближёнными и более простыми. Эти простые значения должны удовлетворять некой зависимости, нахождение которой, в целом, и есть конечная цель этого метода.

Известно, что функциональная зависимость между величинами может быть либо точной (этот случай характерен для теоретических измышлений), либо приближённой (что более характерно для экспериментально полученных данных). Эта неточность, отклонение полученного значения от искомой зависимости, на графике выражающаяся в разбросе точек на некотором расстоянии от кривой (здесь я немного забегаю вперёд) может иметь несколько причин:

1. Погрешности прямых измерений (приборные), ошибки, допускаемые человеком (здесь я, конечно, не говорю о грубых ошибках, дающих значительные отклонения).

2. Несовершенством человеческих знаний о природе – отнюдь не все современные научные концепции позволяют точно рассчитать какие-либо значения для реальных случаев – многие из них направлены на случаи идеальные.

3. Сложностью и изменчивостью самой природы (особенно – живой). Например, в случае проведения социологических исследований, точное совпадение экспериментальных данных с теоретическими вовсе и не требуется – даже незначительная корелляция результатов эксперимента с ожидаемыми закономерностями уже может сказать специалистам о многом.

При выборе аппроксимации следует исходить из конкретной задачи исследования. Обычно, чем более простое уравнение используется для аппроксимации, тем более приблизительно получаемое описание зависимости. Поэтому важно считывать, насколько существенны и чем обусловлены отклонения конкретных значений от получаемого тренда. При описании зависимости эмпирически определенных значений можно добиться и гораздо большей точности, используя какое-либо более сложное, многопараметрическое уравнение. Однако нет никакого смысла стремиться с максимальной точностью передать случайные отклонения величин в конкретных рядах эмпирических данных. Гораздо важнее уловить общую закономерность, которая в данном случае наиболее логично и с приемлемой точностью выражается именно двухпараметрическим уравнением степенной функции. Таким образом, выбирая метод аппроксимации, исследователь всегда идет на компромисс: решает, в какой степени в данном случае целесообразно и уместно «пожертвовать» деталями и, соответственно, насколько обобщенно следует выразить зависимость сопоставляемых переменных. Наряду с выявлением закономерностей, замаскированных случайными отклонениями эмпирических данных от общей закономерности, аппроксимация позволяет также решать много других важных задач: формализовать найденную зависимость; найти неизвестные значения зависимой переменной путем интерполяции или, если это допустимо, экстраполяции.


Постановка задачи

1. Используя метод наименьших квадратов функцию , заданную таблично, аппроксимировать

а) многочленом первой степени ;

б) многочленом второй степени ;

в) экспоненциальной зависимостью .

2. Для каждой зависимости вычислить коэффициент детерминированности.

3. Вычислить коэффициент корреляции (только в случае а).

4. Для каждой зависимости построить линию тренда.

5. Используя функцию ЛИНЕЙН вычислить числовые характеристики зависимости y от x .

6. Сравнить свои вычисления с результатами, полученными при помощи функции ЛИНЕЙН.

7. Сделать вывод, какая из полученных формул наилучшим образом аппроксимирует функцию .

8. Выполнить обработку заданных экспериментальных данных с использованием встроенных функций интерполяции (аппроксимации) и регрессии пакета MathCAD и сравнить результаты с результатами, полученными в Microsoft Excel.


Общие сведения

При экспериментальном изучении функциональной зависимости y = f(x) производят измерения величины y при различных значениях величины x. Результаты представляют в виде таблицы 1 или графически.

X x 1 x 2 ××× x n
Y x 1 Y 2 ××× y n

Таблица 1

Задача заключается в аналитическом представлении искомой функциональной зависимости, т.е. в подборе формулы, описывающей результаты эксперимента. Эмпирическую формулу обычно выбирают из достаточно узкого класса функций, рассматривая, например, множество функций линейных, степенных, показательных и т.п. При этом руководствуются какими либо теоретическими соображениями или соображениями простоты представления эмпирического материала. Найденная эмпирическая формула должна быть такой, чтобы вычисленные по ней значения функций при X=x i возможно мало отличалось бы от опытных данных y i (i = 1, 2, …,n).

Обозначим выбранную функциональную зависимость

будет минимальной. Таким образом, параметры а 1 , а 2 , …, а m определяются из условия, чтобы сумма квадратов отклонений измеренных значений y i от принимала наименьшее значение.

Используя необходимые условия экстремума функции нескольких переменных, получим нормальную систему для определения коэффициентов а 1 , а 2 , …, а m

где а1, а2 –неизвестные параметры, а система (1.3) примет вид

где a, b –постоянные причем x > 0 и y > 0.

Логарифмируя равенство (1.2.1), получим

и применив формулы (1.1.2), найдем значения параметров b и u, а затем значение параметра а.

Показательную зависимость

Полагая v = lny, c = lna, Y = x, получим линейную зависимость

Таблица №3.6

Чем меньше значение Q, тем лучше соответствует эмпирическая формула экспериментальным данным.


В каждом задании требуется методом наименьших квадратов найти теоретическую функциональную зависимость для функции, заданной таблично. В качестве теоретической функциональной зависимости использовать:

– Многочлен первой степени ,

Показательную функцию ,

Степенную функцию ,

– Многочлен второй степени .

Для каждой зависимости найти теоретическое значение функции, сумму квадратов отклонений эмпирических значений функции от теоретических значений, указать наименьшее значение этой величины и аппроксимирующую функцию, которой оно соответствует. Построить линию тренда для каждой зависимости и показать уравнение этой линии на диаграмме. Показать на диаграмме величину коэффициента детерминированности R 2 . Этот коэффициент вычисляется по формуле

, (2.1)

где -заданные значения функции,

Теоретические значения функции,

Среднее арифметическое значение, i = 1, 2, …,n.

Если коэффициент детерминированности равен 1, то теоретические и эмпирические значения функции полностью совпадают. Если коэффициент

детерминированности равен 0, то теоретическая зависимость выбрана неудачно.

Исходные данные

Был проведён некоторый эксперимент. Его результаты записаны в виде таблицы, где x i – величина, задаваемая исследователем (например – концентрация реагентов в химическом растворе), y i – измеренная величина (в нашем примере это может быть скорость протекания реакции).

x i y i x i y i x i y i x i y i x i y i
0.21 1.62 4.98 40.09 7.96 63.31 12.33 97.77 17.32 126.45
1.19 8.65 5.49 43.56 8.32 67.45 13.21 105.34 18.43 144.34
2.43 16.76 6.07 48.45 9.43 72.87 14.72 112.56 19.38 160.45
3.12 24.45 6.81 52.21 10.21 81.34 15.53 121.89 20.45 161.34
4.54 32.87 7.21 57.34 11.54 89.45 16.23 108.54 21.22 170.59

Таблица 2

Расчет аппроксимаций в табличном процессоре Excel

    Линейная аппроксимация - (Linear approximation) – см. Аппроксимация, Линейность в экономике …

    линейная аппроксимация - линейное приближение Аппроксимацией называется приближенное выражение каких либо величин или объектов через другие более простые величины или объекты. При линейной аппроксимации приближение строится с помощью линейных функций. ] Тематики защита информации EN linear approximation of block ciphers … Справочник технического переводчика

    кусочно-линейная аппроксимация функции - — [Л.Г.Суменко. Англо русский словарь по информационным технологиям. М.: ГП ЦНИИС, 2003.] Тематики информационные технологии в целом EN piecewise linear approximation … Справочник технического переводчика

    Аппроксимация - «замена одних математических объектов другими, в том или ином смысле близкими к исходным» ; в частности приближенное выражение сложной функции с помощью более простых. Например, при кусочно линейной А., непрерывная… … Экономико-математический словарь

    аппроксимация - «Замена одних математических объектов другими, в том или ином смысле близкими к исходным» . В частности — приближенное выражение сложной функции с помощью более простых. Например, при кусочно линейной А., непрерывная… … Справочник технического переводчика

    Группа линейных преобразований векторного пространства Vконечной размерности n над нек рым телом К. Выбор базиса в пространстве Vреализует Л. г. как группу невырожденных квадратных матриц степени пнад телом К. Тем самым устанавливается изоморфизм … Математическая энциклопедия

    Численные методы решения методы, позволяющие получить решение Л. к. з. в виде таблицы его приближенных значений в точках сетки, не используя предварительной информации об ожидаемом виде решения. Для теории этих методов типично предположение о том … Математическая энциклопедия

    Метод решения класса задач статистич. оценивания, в к ром новое значение оценки представляет собой поправку к уже имеющейся оценке, основанную на новом наблюдении. Первая процедура С. а. была предложена в 1951 X. Роббинсом(Н. Robbins) и С. Монро… … Математическая энциклопедия

Среди различных методов прогнозирования нельзя не выделить аппроксимацию. С её помощью можно производить приблизительные подсчеты и вычислять планируемые показатели, путем замены исходных объектов на более простые. В Экселе тоже существует возможность использования данного метода для прогнозирования и анализа. Давайте рассмотрим, как этот метод можно применить в указанной программе встроенными инструментами.

Наименование данного метода происходит от латинского слова proxima – «ближайшая» Именно приближение путем упрощения и сглаживания известных показателей, выстраивание их в тенденцию и является его основой. Но данный метод можно использовать не только для прогнозирования, но и для исследования уже имеющихся результатов. Ведь аппроксимация является, по сути, упрощением исходных данных, а упрощенный вариант исследовать легче.

Главный инструмент, с помощью которого проводится сглаживания в Excel – это построение линии тренда. Суть состоит в том, что на основе уже имеющихся показателей достраивается график функции на будущие периоды. Основное предназначение линии тренда, как не трудно догадаться, это составление прогнозов или выявление общей тенденции.

Но она может быть построена с применением одного из пяти видов аппроксимации:

  • Линейной;
  • Экспоненциальной;
  • Логарифмической;
  • Полиномиальной;
  • Степенной.

Рассмотрим каждый из вариантов более подробно в отдельности.

Способ 1: линейное сглаживание

Прежде всего, давайте рассмотрим самый простой вариант аппроксимации, а именно с помощью линейной функции. На нем мы остановимся подробнее всего, так как изложим общие моменты характерные и для других способов, а именно построение графика и некоторые другие нюансы, на которых при рассмотрении последующих вариантов уже останавливаться не будем.

Прежде всего, построим график, на основании которого будем проводить процедуру сглаживания. Для построения графика возьмем таблицу, в которой помесячно указана себестоимость единицы продукции, производимой предприятием, и соответствующая прибыль в данном периоде. Графическая функция, которую мы построим, будет отображать зависимость увеличения прибыли от уменьшения себестоимости продукции.


Сглаживание, которое используется в данном случае, описывается следующей формулой:

В конкретно нашем случае формула принимает такой вид:

y=-0,1156x+72,255

Величина достоверности аппроксимации у нас равна 0,9418 , что является довольно приемлемым итогом, характеризующим сглаживание, как достоверное.

Способ 2: экспоненциальная аппроксимация

Теперь давайте рассмотрим экспоненциальный тип аппроксимации в Эксель.


Общий вид функции сглаживания при этом такой:

где e – это основание натурального логарифма.

В конкретно нашем случае формула приняла следующую форму:

y=6282,7*e^(-0,012*x)

Способ 3: логарифмическое сглаживание

Теперь настала очередь рассмотреть метод логарифмической аппроксимации.


В общем виде формула сглаживания выглядит так:

где ln – это величина натурального логарифма. Отсюда и наименование метода.

В нашем случае формула принимает следующий вид:

y=-62,81ln(x)+404,96

Способ 4: полиномиальное сглаживание

Настал черед рассмотреть метод полиномиального сглаживания.


Формула, которая описывает данный тип сглаживания, приняла следующий вид:

y=8E-08x^6-0,0003x^5+0,3725x^4-269,33x^3+109525x^2-2E+07x+2E+09

Способ 5: степенное сглаживание

В завершении рассмотрим метод степенной аппроксимации в Excel.


Данный способ эффективно используется в случаях интенсивного изменения данных функции. Важно учесть, что этот вариант применим только при условии, что функция и аргумент не принимают отрицательных или нулевых значений.

Общая формула, описывающая данный метод имеет такой вид:

В конкретно нашем случае она выглядит так:

y = 6E+18x^(-6,512)

Как видим, при использовании конкретных данных, которые мы применяли для примера, наибольший уровень достоверности показал метод полиномиальной аппроксимации с полиномом в шестой степени (0,9844 ), наименьший уровень достоверности у линейного метода (0,9418 ). Но это совсем не значит, что такая же тенденция будет при использовании других примеров. Нет, уровень эффективности у приведенных выше методов может значительно отличаться, в зависимости от конкретного вида функции, для которой будет строиться линия тренда. Поэтому, если для этой функции выбранный метод наиболее эффективен, то это совсем не означает, что он также будет оптимальным и в другой ситуации.

Если вы пока не можете сразу определить, основываясь на вышеприведенных рекомендациях, какой вид аппроксимации подойдет конкретно в вашем случае, то есть смысл попробовать все методы. После построения линии тренда и просмотра её уровня достоверности можно будет выбрать оптимальный вариант.



© 2024 gimn70.ru -- Учимся легко - Портал полезных знаний