An introduction to educational research methods. Введение в образовательные исследовательские методы Білім беру-зерттеу әдістеріне кіріспе



Pdf көрінісі
бет55/85
Дата06.03.2017
өлшемі32,4 Mb.
#8078
1   ...   51   52   53   54   55   56   57   58   ...   85

 

 

Жалпыұлттық 

орташа көрсеткіш 


Taking A Quantitative Approach

480


Көрсеткіштердің мәнмәтінді өсуі

Тиімділік көрсеткіштерін пайдалану бәрібір оқушылардың үлгерімінің барлық 

өзгерістерінің мектепте орын алатын жайтпен анықталатынын білдіреді. Алайда 

үлгерімге әсер ете алатын басқа да айнымалылар туралы не айтасыз? Олардың әсерін 

мектептің әсерінен айыруға мүмкіндік бар ма? 

 

Алғашқы талпыныстар әлеуметтік-экономикалық мәртебенің көрсеткіші ретінде 



мектепте ақысыз тамақ ішетін оқушылардың санына түзетулер жасады. Содан кейін 

2006 жылы үкімет мейлінше күрделі статистикалық үлгіні жасап шығарды. Олар сәйкес 

келетін айнымалыларды сәйкестендіруге және әрбір оқушының «күтілетін» үлгерімін 

болжау тәсілін табу үшін көп деңгейлі үлгілеу ретінде аталатын ақылды статистика 

көмегімен, бірінен соң бірінің әсерін жоюға талпыныс жасады. Осы «күтілетін» үлгерім 

деңгейінен ауытқу мәнмәтінді тиімділік көрсеткіші болады (contextual-value-added 

(CVA)). Үлгіні есептеулерге кіретін айнымалылар жылдан-жылға өзгеріп отыруы мүмкін, 

алайда, ережеге сәйкес, төмендегілерді қамтиды: 

•  оқушының үлгерімінің алдыңғы деңгейі 

•  жынысы

•  ерекше білім беру қажеттіліктері 

•  бірінші тіл

•  оқушының жылжымалылық көрсеткіштері 

•  жасы


•  оқушының «тәрбиеленгенінің» көрсеткіші 

•  этникалық тиесілігі

•  ақысыз мектепте тамақтану

•  аз қамтылған жанұялардан мектеп жасындағы балалардың жалпы оқушылар санына 

қарым-қатынасы (Income Deprivation Affecting Children Index (IDACI))

9.5 тапсырма

9.4 суретке қараңыз. Онда үш мектеп үшін орташа көрсеткіштер мен сенім 

білдіру шекаралары ұсынылады. А мектебінде 2000 оқушы, ал В мектепте 

– 500 оқушы, ал С мектепте – 2000 оқушы бар. Келесі ойлардың қайсысын 

95% сенімділікпен бекітуге болады? 

•  A мектебі жалпы ұлттық орташа көрсеткіштен айтарлықтай төмен.

•  В мектебі жалпы ұлттық орташа көрсеткіштен айтарлықтай жоғары.

•  C мектебі жалпы ұлттық орташа көрсеткіштен айтарлықтай жоғары.

•  А мектебі мен В мектебінің арасында айтарлықтай айырмашылық жоқ.

•  В мектебі мен С мектебінің арасында айтарлықтай айырмашылық жоқ.

•  А мектебі мен С мектебінің арасында айтарлықтай айырмашылық жоқ.


Taking A Quantitative Approach

481


•  мектептегі орташа көрсеткіш пен алдыңғы үлгерім аралығы (тек KS2–3, KS2–4 

және KS3–4).

Бұл мектептің тиімділігін бағалау үшін «әулие Грааль» сияқты көрінеді, алайда дәл осы 

үлгімен бірнеше мәселе байланысты. CVA үлгісі жетіспейтін мәліметтерге қатысты 

қолданатын тәсіл жүйелік қателікті тудыруы мүмкін және кейбір айнымалылар да өзара 

әрекеттесуі және сызықтық емес тәсілдермен CVA әсер етуі мүмкін (мәсел., төменгі 

кіріс көзі ересектерге қарағанда кіші сыныптардағы оқушылардың үлгеріміне әсер 

ете алады). Осы мезеттерді есепке ала отырып, CVA – 1991 жылдан бастап түзілген 

бірнеше тиімділік көрсеткіштерінің бірі болып табылады, оның ішінде Фишер жанұялық 

қорының және білімді басқару орталығымен түзілген үлгілермен берілген балдарды 

қоса алғанда (Centre for Educational Management (CEM)) Дарем Университеті 

(мәселен: MIDYIS, Yellis және ALIS). Осы үлгілерді жасау үшін пайдаланылған тұрғындар 

туралы мәліметтерді, сонымен қатар кейбір қамтылған айнымалыларды, алайда 

әрқайсысы CVA ұқсас әдіске негізделген, мәліметтер ерекшеленеді. 

 

Осындай түрдегі үлгілермен ұсынылған мәліметтер мектепті жетілдіруді 



жоспарлау үшін (мәсел., мектептер, мұғалімдер немесе оқушылар үшін), өз баласы 

үшін мектепті таңдау кезінде ата-аналармен есептілік үдерістерінің бір бөлігі ретінде 

(мәсел., Ofsted арқылы) пайдаланылған. Сіз. мүмкін, жоғарыда аталған атаулардың 

көпшілігін білетін боларсыз. Шын мәнісінде, білім саласындағы стандарттарды басқару 

саласы мектепті жетілдіру үшін CVA мәліметтерін пайдалану дәлелдемелерін ұсынуға 

мәжбүрлеп отыр. Ол үшін олардың мектептеріне онлайндық RAISE платформасы 

арқылы мәліметтер ұсынады және CVA мәліметтері ата-аналардың танысуы үшін 

жарияланатын болады. Алайда бір мәліметтерді пайдалану және, сәйкесінше, осы 

міндеттердің әрқайсысы үшін бір үлгіні пайдалану қиындау болуы мүмкін және осындай 

үлгілерге қатысатын айнымалылар осындай үлгіні пайдалану саласына байланысты 

ерекшеленуі тиіс. 

 

Мәселен, егер CVA келешектегі жетістіктерді болжау үшін пайдаланылатын 



болса (көптеген СЕМ үлгілеріндегі оқушылар жағдайында), онда бұл үлгіні болжамды 

мейлінше нақты ету үшін әрбір факторда қамту қажет. Басқа жағынан алғанда, егер 

CVA мектепті жетілдіру үшін назар ретінде пайдаланылатын болса, онда мектепке шын 

мәнісінде бақылай алатын айнымалыларды ғана қамту орынды болады. Сәйкесінше, 

егер CVA есептілік үшін пайдаланатын болса, онда барлық мүдделі тараптар 

келтірілген көрсеткіштердің мәнін түсіне алуы тиіс және сондықтан осыған ұқсас 

күрделі көп деңгейлі үлгілеуді қолдану орынсыз болуы мүмкін.

 

Жоғарыда аталғандарды есепке ала отырып, мүмкін көрінетін дәлдік пен 



тиімділік рейтингісінің «құзыреттілігі», атап айтқанда CVA немесе Фишер жанұялық 

қорының рейтингісі ата-аналарды, мұғалімдер мен балаларды тығырыққа тиеуі мүмкін, 

оларды ешқандай мәлімдемесіз осындай мәліметтерге сенуге мәжбүрлеуі де мүмкін. 

Жағдаяттың екі жақсы мысалы бар, онда CVA мәліметтері ата-аналарға түсіндіруге 

қатысты мәселе тудыруы мүмкін. 

1 Ата-аналар ең жоғарғы тиімділік рейтингісінің сенім білдіру аралықтарын есепке 

алмастан үздік мектепті анықтай алатынын біз көріп отырмыз. Алайда, CVA үлгілері, 


Taking A Quantitative Approach

482


мәселен, соңғы жеті жыл ішінде мектепке барған оқушылардың мәліметтерін 

пайдаланатынын есепке ала отырып, шын мәнісінде олардың келешекте мектептің 

тиімділігі туралы ойды оқушыларға жеткізе алмауы мүмкін (ең соңында, егер сіздің 

балаңыз мектепте оқуды бастаса, оның көрсеткіштерінің жеті жылдан кейін қалай 

болатынын білгіңіз келеді). Оның орнына олар мектептің алдыңғы жылдардағы 

көрсеткіштерін бейнелейді және келешекте мектептің көрсеткіштерін болжаумен 

байланысты белгісіздікті есепке алмайды. Статистиктер CVA үлгісіне қандай да бір 

белгісіздік енгізетін кезде, мектептің болжамды көрсеткіштері ұқсас болғандығы 

соншалықты, CVA рейтингісінің негізінде мектептерді айыру мүмкін болмай қалады. 

2 Мектептің CVA рейтингісі ата-аналарға мектепті таңдауға көмек беретін үлгіні құру 

кезінде үлгіге қамтылған бірқатар факторларды есепке ала отырып, оның тиімділік 

көрсеткіші болуы мүмкін, мектеп деңгейінің айнымалысын есепке алмау маңызды 

болып табылады. Бұл жағдай ата-ананың білгісі келетін белгілі бір мектептің (барлық 

мәнмәтіндік ерекшеліктермен қатар) балаға (оның жеке ерекшеліктерімен) басқа 

мектепке қарағанда жақсы білім бере алатынтығын анықтаумен түсінідіріледі. Егер 

мектеп факторлары белгілі бір жетістікпен байланысты болатын болса, онда бұл ата-

ананы қызықтыратын әсердің бір бөлігі болып табылады. Сондықтан бастапқы CVA 

мәліметтерін пайдалану орынсыз болады. 

 

Ата-аналар мен басқалар да өз тұжырымдарын өздері түсінетін көрсеткіштерге 



негіздейді және мектеп көрсеткіштері туралы бастапқы мәліметтерді жариялауды 

жалғастыру тығырыққа тиеуі мүмкін. Алайда ата-аналар мен мұғалімнің CVA сияқты 

тиімділік рейтингісінің мектеп немесе мұғалімнің тиімділік көрсеткішінің тар көрсеткіші 

болып табылатынын және мұндай мәліметтер шын мәнісінде жөнелту нүктесі ретінде 

пайдалануға болатынын түсіну маңызды. 

Негізгі ойлар

•  Өз мәліметтерін сипаттау және талдау үшін сандық тәсілді пайдалана 

аласыз. 

•  Эксперименталды зерттеу тәуелді айнымалыға әсер ете алатын барлық 

басқа айнымалыларды есепке ала отырып бір айнымалының (тәуелсіз 

айнымалы) басқа айнымалыға өзгеруін қамтиды. 

•  Эксперименталды емес зерттеу басқа айнымалылардың әсерін есепке 

ала  отырып,  айнымалылар  арасындағы  әлеуетті  себеп-салдарлық 

байланыстарды іздеу арқылы құбылыстарды түсіндіруді іздеуді қатиды. 

•  А және Б айнымалыларының арасындағы байланыс А-ның Б-ның артуына 

әкеп соқтыратынын білдірмейді. Барлығы керісінше болуы мүмкін, немесе 

екі бірдей айнымалы да үшінші В айнымалыға байланысты болуы мүмкін. 

•  Мәліметтердің  шығу  тегін  түсіну  (үлгерім  мәліметтері  сияқты)  осы 


Taking A Quantitative Approach

483


Рефлексияға арналған сұрақтар

1.  Өзіңіздің басшыңыздан немесе сыни көзбен қарайтын досыңыздан сіздің 

ақпарат жинау жоспарыңызды, жұмысқа кіріспес бұрын, қарап шығуын 

сұрадыңыз ба – олар сіз назардан тыс қалдырып қойған айнымалыларды 

ұсынуы мүмкін? 

2.  Сіздің  мәліметтеріңіздің  шектеулері  қандай?  Өз  әдістеріңіз  бен 

қорытындыларыңызды  сыни  көзбен  қарай  отырып  қабылдаңыз.  Кез 

келген  зерттеушінің  мәліметтері  шектеулерге  ие  –  оларға  қатысты 

ашық болу маңызды. 

3.  Өз  қорытындыларыңызға  сенімдісіз  бе?  Мәліметтердің  сізге  не 

айтатынына қатысты мұқият болыңыз. Өзіңіздің алдыңғы жоспарыңызға 

сәйкес,  баламалы  түсіндірмелерді  есепке  алмастан,  мәліметтерді 

түсіндіруден абай болыңыз. Басқа бір кісі дәл осылай жасап қоюы мүмкін 

екендігіне абай болыңыз!

мәліметтерге қатысты ақпараттанған қорытынды үшін аса маңызды. 

•  Сандардан  қорықпаңыздар  –  егер  сіз  математикадан  соншалықты 

қабілетті  болмағанның  өзінде,  бұл  маңызды  емес.  Сандар  жайында 

ойлағанда,  олардың  сіздің  көмекші  құралыңыз  екендігі  туралы,  сізге 

белгілі бір жайтты түсіну үшін көмек беретіні жайында ойланыңыз. 

•  Мәліметтерді мейлінше жоғарғы өлшеу деңгейінде жинақтаңыз. 

•  Айнымалылар  арасындағы  байланыстың  болуының  бір  де  бір  дерегі 

оның басқасының өзгеруін туындататынын білдірмейді. 



Қосымша оқу үшін

Cohen, L., Manion, L. and Morrison, K. (2011) Research Methods in Education. (7th edn).

London: RoutledgeFalmer. 

Brace, N., Kemp, R. and Snelgar, R. (2009) SPSS for Psychologists (4th edn). Basingstoke: 

Palgrave Macmillan.

Coolican, H. (2009) Research Methods and Statistics in Psychology (5th Edn). London:

Hodder & Stoughton.

Field, A. (2009) Discovering Statistics Using SPSS (3rd edn). London: Sage.

Sani, F. and Todman, J. (2008) Experimental Design and Statistics for Psychology.

(2nd Edn). Oxford: Blackwell Publishing.

For the Curriculum, Evaluation and Management Centre at the University of Durham

(for ALIS, Yellis, etc.), visit: www.cemcentre.org



Analysing Quantitative Data

484


Analysing Quantitative Data

485


ANALYSING QUANTITATIVE DATA

ROS MCLELLAN

CHAPTER 10

Chapter Overview

This chapter is about how to use some statistical techniques to start to analyse and 

interpret quantitative data. I am not claiming that you will be an expert by the end of 

the chapter but I hope you will have the confidence to get started. Those of you who 

want to pursue this type of approach will need to consult more specialist texts, and 

some appropriate references are listed at the back of the chapter that you’ll need to 

move on to.


Analysing Quantitative Data

486


INTRODUCTION

Let’s start by debunking a myth. You do not have to be brilliant at mathematics to do 

quantitative analysis. Many people are put off statistics by the complicated-looking equations 

they see, but computers can do the number crunching for you, and at one level you don’t 

need to understand any of the hieroglyphics you might see in advanced statistical

texts. What is important is that you understand some basic concepts and what

sorts of analysis are appropriate to apply to answer particular questions. An appropriate

analogy is that of driving a car: you need to know to put fuel in (the basic concept of fuel

provides the driving force) and how to drive (the right technique for the situation – for

instance, not to brake too sharply on a frosty morning), but you don’t need to understand

the underlying mechanical and electrical engineering principles which make it

operate, if you just want to drive it. Similarly, with statistics; you need to know the statistical

entities you might calculate and what would be appropriate to the situation in

hand, but you don’t need to have a detailed understanding of how the computer processes

data to calculate these entities. This chapter therefore aims to give you a sense of these

basic entities and processes and to introduce you to a particular statistical package, SPSS,

which is widely used to do such number crunching.

 

The other important point I would like to make before we get down to business is



that analysis is not something you start thinking about once you have collected all your

data. This is a common error made by newcomers to research. If you don’t think about

analysis before you collect your data, it is quite likely that your data won’t be able to

answer the questions you wanted to ask. For instance, if you wanted to examine the

relationship between ability and motivation, it would not be enough to use ability band/

stream as a measure of ability if you wanted to know whether the motivation of the most

able students in the top band/stream was different to those who had just scraped into

that band/stream. A finer graded scale or instrument for measuring ability, such as the

NFER Cognitive Ability Tests, would need to be used. Hence, you need to think ahead

and pre-empt the type of questions you want to ask, in order to plan data collection

accordingly. As a rule of thumb, collect data at the highest level of measurement you can

sensibly manage because you can create discrete categories from data measured on a

continuous scale (such as the ability categories ‘low’, ‘average’ and ‘high’ by deciding

cut-off points on an ability scale), while you cannot create a continuous scale from discrete

categories.

 

It should now be clear that it is essential to consider what analysis you want to do



during the initial design stages of the research so that appropriate data, as far as possible,

is collected in the first place. For this reason, if you have not yet read Chapter 11,

I strongly urge you to at least skim through it before going any further.

Now we can turn to the matter in hand: the analysis of quantitative data. Assuming

you are planning to use a computer to assist you in this process, the first step is to set

up a database using the appropriate software program. In this chapter, I will be referring

to the SPSS package, as this is the most widely used program of this type in the social

sciences, and most higher education institutions subscribe to it. Once the data is

entered, analysis, which has two distinct phases, can be conducted. The first phase is to


Analysing Quantitative Data

487


describe the data that has been gathered, which involves the calculation of descriptive

statistics and the graphical presentation of the data. The second phase is to interrogate

the data to answer the research questions posed, which entails calculating inferential statistics. 

The rest of the chapter, therefore, gives an overview of each of these steps. As it is easier to 

understand such processes if they are discussed with reference to a specific example, data 

gathered during my PhD research will be used for illustrative purposes. I start therefore with 

a brief description of my PhD research in order to contextualize the examples given in the 

rest of the chapter.



THE EXAMPLE DATABASE

Cognitive Acceleration through Science Education (CASE) is an intervention programme 

consisting of 30 science activity lessons for students in Years 7 and 8, which aims to promote 

cognitive development. It is widely used by secondary schools, despite the fact that some 

students make very limited progress, and it has been suggested that student motivation 

might account for this, but this had not been investigated. Consequently, my main research 

question  was: ‘Do  differences  in  motivation  account  for  the  differential  gains  made  by 

students doing CASE?’. I was also interested in whether there was any difference in the 

progress made by boys and girls, as the literature suggests that girls are more motivated than 

boys; and in school generally, girls get better exam results than boys. Employing a longitudinal 

quasi-experimental design so that I could compare students following the CASE programme 

with similar students that were not (to allow for normal cognitive development), I followed a 

cohort (over 1700 students) through the first two years of secondary school in nine schools 

(five doing the CASE programme and four not). This is probably a lot more students than 

you might be considering including in your study, as in all likelihood you are studying students 

in your own school. However, the process of analysis is the same whether your sample size 

is 1700, one year cohort, or one class.

 

I  assessed  the  cognitive  development  and  motivation  at  the  start  of Y7  (before 



starting CASE – the pre-test) and at the end of Y8 (after completing the programme – the 

post-test) so that changes in cognitive development could be measured. I could also see 

whether any changes in motivation had occurred. Here, we will only focus on some of the data 

gathered at pre-test. I used a commercially available test to measure cognitive development 

(a  Science  Reasoning Task). This  is  conducted  as  a  series  of  teacher-led  demonstrations, 

which students then have to answer questions about on an answer sheet. Answers are 

marked using the mark scheme provided and then the total score is converted to a level of 

cognitive development (a numerical score which is an interval level measurement).

 

Motivation can be measured in many ways, according to which theory of motivation 



you  subscribe  to.  I  chose  a  framework  that  suggested  there  were  four  dimensions  to 

motivation. Each dimension can be assessed using a scale comprising a number of items, 

which students are asked to respond to. I used a questionnaire that had been used in previous 

research. There is a common stem for each item – ‘I feel successful when’ – and students 

indicate their level of agreement on a five-point Likert scale (from ‘strongly disagree’, scoring 

1 to ‘strongly agree’, scoring 5). The overall score for each dimension is the total score of the 

individual items for each scale. An example


Analysing Quantitative Data

488


item from each of the four scales is shown in Table 12.1, to give a sense of what the

four dimensions relate to.

 

I asked students to give their opinion about science, English, and school in general,



as these were different areas I was interested in. Hence, the database contained three

answers to each question, and separate total scores for each dimension for the different

subject areas.

 

Now that you have a sense of the data I gathered, we can consider how I set up the



SPSS database to do the analysis.

Table 10.1

 Example items in motivation questionnaire



CREATING A DATABASE IN SPSS

In this section, I will take you through some of the issues you need to consider when

setting up an SPSS database, illustrating these with reference to my own database. If you

go to the website, you will find a tutorial that takes you through the process of setting

up a database using SPSS, which you will probably find helpful to look at in conjunction

with this section. At the end of the section, you will find an activity to allow you to check

that you have understood how to set up a database.

 

Blank databases in SPSS look quite like Excel spreadsheets when you open them 



initially, however, unlike Excel, there are two ways of looking at the same database: ‘data

view’ and ‘variable view’.

 

‘Data view’ (the default shown on opening a database) shows you the actual data 



Activity 10.1

Collect data from the On Motivation questionnaire (see Appendix at the end 

of the chapter). Use this data to follow the steps in the text to learn how to 

use SPSS.

SCHOOL-BASED RESEARCH

192


(from ‘strongly disagree’, scoring 1 to ‘strongly agree’, scoring 5). The overall score for 

each dimension is the total score of the individual items for each scale. An example 

item from each of the four scales is shown in Table 12.1, to give a sense of what the 

four dimensions relate to.

I asked students to give their opinion about science, English, and school in general, 

as these were different areas I was interested in. Hence, the database contained three 

answers to each question, and separate total scores for each dimension for the different 

subject areas.

Now that you have a sense of the data I gathered, we can consider how I set up the 

SPSS database to do the analysis.

Activity 12.1 

Collect data from the On Motivation questionnaire (see Appendix at the end of the 

chapter). Use this data to follow the steps in the text to learn how to use SPSS. 

Creating a database in SPSS

In this section, I will take you through some of the issues you need to consider when 

setting up an SPSS database, illustrating these with reference to my own database. If you 

go to the website, you will find a tutorial that takes you through the process of setting 

up a database using SPSS, which you will probably find helpful to look at in conjunction 

with this section. At the end of the section, you will find an activity to allow you to check 

that you have understood how to set up a database.

Blank databases in SPSS look quite like Excel spreadsheets when you open them ini-

tially, however, unlike Excel, there are two ways of looking at the same database: ‘data 

view’ and ‘variable view’.

Table 12.1  Example items in motivation questionnaire

Scale

Underlying Motivation



Example Item

1

Task



To develop competence

… I finally understand a really 

complicated idea

Ego


To demonstrate competence

… I do better work than other students

Work Avoidance

To avoid demonstrating 

incompetence (passive avoidance)

… I don’t have to do any homework

Alienation

To avoid demonstrating 

incompetence (active disruption)

… I mess around and get away with it



Note

1

The common stem is ‘I feel successful when’.



13-Wilson-Ch-12.indd   192

8/31/2012   5:41:40 PM



Analysing Quantitative Data

489


in your database. Each row represents one ‘case’. I collected data from over 1700 students, 

hence I have over 1700 rows in my database. Cases do not need to be individual people. 

If, for instance, you have collected data about schools rather than individual students, then 

the rows would represent each school. The columns represent each variable you have 

collected data on. In my study, this includes demographic data (such as gender), level of 

cognitive development score, and answers for each of the questions on the questionnaire. 

There are also a number of variables I created in the database from existing variables. For 

instance, there are variables for the total scores for each motivation dimension.

 

‘Variable view’ provides information about each of your variables. This is one of 



the ways SPSS differs from a spreadsheet – because it is a database, it can hold all sorts of 

useful information about your variables that Excel isn’t capable of, and this information is 

needed for conducting statistical analyses. Before entering data, you set up your variables 

in variable view. Here, each row relates to one variable and the columns represent specific 

characteristics of the variable. To avoid later grief, it is well worth defining your variables 

fully before entering data, as SPSS has default settings which may not be appropriate for all 

your variables.

 

Regardless of whatever else you have data for, it is sensible to define your first 



variable as a unique identifier for each case, so that you have a way of going back to the 

original data you collected later if you need to. For data protection and ethical reasons, 

you should create a code rather than type in an identifiable name. I therefore called my 

first variable ‘ID’. You are limited to eight characters for variable names and if you attempt 

to type in more, SPSS will truncate it. However, you can list a name in full, such as ‘unique 

identifier’ under ‘label’ and when you later do analysis, SPSS will use what is listed under the 

label rather than the variable name in its output of results.

SPSS will generate default information for the remaining headings. Although most of these 

are appropriate, you do need to consider ‘type’, ‘values’, ‘missing’ and ‘measure’.  

SPSS has different options for these already stored. For instance, for ‘type’, you can select 

from many options, including numerical and string. I decided that the easiest way to give 

a unique identifier to every student’s response would be to give each student a number 

and to write this number on their questionnaires/cognitive development test sheets. Thus, 

I selected ‘numerical’ under ‘type’ for variable ‘ID’. It is possible that you might want to give 

non-numerical codes, for instance pseudonyms (but note that if you have a large number 

of cases, this can quickly get confusing so it is often better to stick to numbers). In this case, 

you would select ‘string’ as the type, and in both cases, the ‘measure’ is ‘nominal’.

 

In order to understand how to use ‘values’ and ‘missing’, we need to turn to a 



different variable. I wanted to record some background demographic information, and it is 

quite likely that you would want to do the same. For instance, I wanted to record whether 

each student was male or female. Thinking ahead, I knew I wanted to compare boys and 

girls on a number of dimensions (for instance, scores on the ‘task’ motivation scale). To do 

this sort of analysis, you have to create a numerical rather than string variable, so I chose 

‘numerical’ under type and ‘nominal’ under ‘measure’. I used the code 1 to represent boys 

and 2 to represent girls, and recorded this information under ‘values’.

 

As with variable labels, SPSS shows value labels rather than numerical codes in 



analyses,

Analysing Quantitative Data

490


which is handy as you don’t have to remember whether ‘1’ represents ‘boys’ or ‘girls’

(although of course you can look this up at any time in variable view).

 

It is important to set up missing data values for variables where missing data is very



likely to occur. For instance, although students were asked to indicate their gender on

the front of their questionnaires, a number did not, and as gender is not always obvious

from a name (for instance, Sam can be a girl or a boy), in these cases, it needed to be

recorded as missing. Setting up a special numerical code for missing data enables SPSS

to recognize cases where data is missing and omit them from specific analyses. You

define one or more values to represent missing values under ‘missing’. Usually, you

would define one value and this can be whatever you like, as long as it is not a value you

have already used in your coding (so I couldn’t use 1 or 2 for gender), but traditionally

researchers tend to use ‘9’ or ‘99’ so that missing data stands out. You can use different

values for different variables but I would caution against this, as it will get confusing. You

might define more than one missing value to represent different reasons for the data

being missing – for instance, ‘the student was away on the day of the test’ compared to

‘the student missed one question on a test’, but again keep it simple to start with.

 

Once you have set up all the variables you want to include, you can then start to 



enter your data. You do this in ‘data view’, where you will find that the column headings 

now refer to the variables you have defined. Entering data is a simple case of typing in the

relevant values for each variable for each case. Usually, you would enter all the data on

your first case before moving on to your second, but of course you can go back at any

time to add in any missing data gathered at a later point in time. So in my database, I

started with the first student I had data for, and typed ‘1001’ under ‘ID’, ‘2’ under ‘gender’

because she was a girl, and so forth. If you forget any of your codes, you can always

check under value labels in variable view. Don’t forget to save periodically.

 

You will probably come across some problems with data entry, for instance stu-



dents who have ringed two answers on a questionnaire. There are various ways of dealing 

with this. You can either go back to the student and get them to clarify their response 

(which is time-consuming); you can code it as a missing response (this is probably the best

approach but you may then be losing a lot of data), or you can decide to code new values

to allow midpoints on scales (but this can distort later analysis). Whatever approach

you choose, make sure you apply it consistently.




Достарыңызбен бөлісу:
1   ...   51   52   53   54   55   56   57   58   ...   85




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет