Данные о местных ценах пуда ржи в России за 1878 – 1887 гг.
По сведениям Интендантства (1), губернских правлений (2) и Департамента земледелия (3).
Сведения
|
1878
|
1879
|
1880
|
1881
|
1882
|
1883
|
1884
|
1885
|
1886
|
1887
|
1
|
90
|
84
|
112
|
139
|
98
|
83
|
94
|
79
|
71
|
58
|
2
|
65
|
69
|
72
|
109
|
86
|
82
|
78
|
69
|
62
|
55
|
3
|
61
|
63
|
64
|
103
|
84
|
83
|
72
|
64
|
58
|
47
|
Мы видим, что данные не совпадают, а более или менее различаются. Если данные источников различаются существенно, то один из источников сообщает недостоверные сведения; если данные различаются несущественно, то сведения однородны, источники сообщают достоверные сведения.
Построить графики этих рядов, что позволит лучше оценить степень их разнородности, поскольку по табличным данным, когда их большое количество очень трудно выявить все расхождения.
Графическое изображение статистического материала позволяет глубже проникнуть в смысл цифровых величин, уловить их взаимозависимости и черты изучаемого явления, которые трудно заметить в таблице.
Определить важнейшие статистические характеристики этих рядов и определить степень расхождения между ними. Если окажется, что характеристики рядов близки между собой, то данные статистические ряды однородны и что разные источники при отдельных несовпадениях, в целом одинаково характеризуют исследуемое явление, то это говорит в пользу достоверности статистических данных.
В нашем случае сведения трех источников разнородны. Для анализа степени разнородности данных используем статистические характеристики трех рядов цен: среднюю арифметическую, дисперсию, ошибку средней и коэффициент вариации.
Коэффициент вариации равен отношению стандартного отклонения к средней арифметической и выражается в процентах.
Сведения
|
Средняя арифметич.
|
дисперсия
|
Случайная ошибка
средней
|
Коэффициент вариации
|
Абс.
|
%
|
Абс.
|
%
|
Абс.
|
%
|
|
1
|
90,8
|
130
|
454,96
|
195
|
6,745
|
140
|
23,5
|
2
|
74.6
|
107
|
209,04
|
90
|
4,572
|
95
|
19,4
|
3
|
59,9
|
100
|
233,29
|
100
|
4,830
|
100
|
25,5
|
V = sx : x (по сведениям Интендантства (1) v = 21.33 : 90.8 = 0,235(23,5%)
Когда анализируется достоверность статистических рядов, то полезно выяснить степень согласованности в колебаниях составляющих их данных, так как в однородных рядах не только средние различаются несущественно, но и все соответствующие члены рядов изменяются согласованно. Для этого существует коэффициент корреляции.
Корреляция это статистическая зависимость двух и более независимых друг от друга величин (величины, являющиеся таковыми хотя бы в некоторой степени). При этом изменение значения одной из них приводит к изменению значения других. В том случае, когда изменение одной из величин не приводит к закономерному изменению другой величины, то можно говорить об отсутствии корреляции между этими величинами.
Коэффициенты корреляции могут быть положительными и отрицательными. Если при увеличении значения одной величины происходит уменьшение значений другой величины, то их коэффициент корреляции отрицательный. В случае, когда увеличение значений первого объекта наблюдения приводит к увеличениям значения второго объекта, то можно говорить о положительном коэффициенте. Возможна еще одна ситуация отсутствия статистической взаимосвязи — например, для независимых случайных величин.
Коэффициент корреляции - это статистический показатель зависимости двух случайных величин. Коэффициент корреляции может принимать значения от -1 до +1. При этом, значение -1 будет говорить об отсутствии корреляции между величинами, 0 - о нулевой корреляции, а +1 - о полной корреляции величин. Т.е., чем ближе значение коэффициента корреляции к +1, тем сильнее связь между двумя случайными величинами.
Существует много разных формул для вычисления коэффициента корреляции. Если данных мало – используется одна формула, если много - другая. Нет необходимости запоминать эти формулы. Как правило, используются специальные таблицы.
В нашем случае коэффициент корреляции составил между ценами Интендантства и губернских правлений - 0,850, Департамента земледелия и Интендантства – 0,807, губернских правлений и Интендантства – 0,987. Это означает, что все данные достоверны, но в ряде источников имеется систематическая ошибка, причины которой должны исследоваться особо посредством анализа процедуры сбора статистических данных.
3.
А) Регрессионный анализ. Исследуя динамику явлений, историк нередко сталкивается с пропусками данных в источниках. Эти пропуски могут объясняться либо плохой сохранностью источников, либо тем, что массовые сведения по многим вопросам в масштабе всей страны собирались через некоторый, нередко значительный интервал времени. Всякий же временной статистический ряд содержит в скрытом виде информацию об этих пропущенных данных. Получение этих данных, носящих, разумеется, вероятностный характер, решается с помощью интерполяции, составляющей основу регрессионного метода.
Достарыңызбен бөлісу: |