Latin square

Latin square is an n × n array filled with n different symbols, each occurring exactly once in each row and exactly once in each column. Here is an example:

A B C
C A B
B C A

For the past three decades, Latin Squares techniques have been widely used in many statistical applications. Much effort has been devoted to Latin Square Design. In this paper, I introduce the mathematical properties of Latin squares and the application of Latin squares in experimental design. Some examples and SAS codes are provided that illustrates these methods.

——Lei gao 2005

http://www.mth.msu.edu/~jhall/classes/MTH880-05/Projects/latin.pdf

 

The Latin Square design

The Latin square design is used where the researcher desires to control the variation in an experiment that is related to rows and columns in the field.

Field marks:

  • Treatments are assigned at random within rows and columns, with each treatment once per row and once per column.
  • There are equal numbers of rows, columns, and treatments.
  • Useful where the experimenter desires to control variation in two different directions

This is just one of many 4×4 squares that you could create. In fact, you can make any size square you want, for any number of treatments – it just needs to have the following property associated with it – that each treatment occurs only once in each row and once in each column.

Note that a Latin Square is an incomplete design, which means that it does not include observations for all possible combinations of ij and k.  This is why we use notation k = d(i, j).  Once we know the row and column of the design, then the treatment is specified. In other words, if we know i and j, then k is specified by the Latin Square design.

This property has an impact on how we calculate means and sums of squares, and for this reason we can not use the balanced ANOVA command in Minitab even though it looks perfectly balanced. We will see later that although it has the property of orthogonality, you still cannot use the balanced ANOVA command in Minitab because it is not complete.

The randomization procedure for assigning treatments that you would like to use when you actually apply a Latin Square, is somewhat restricted to preserve the structure of the Latin Square. The ideal randomization would be to select a square from the set of all possible Latin squares of the specified size.  However, a more practical randomization scheme would be to select a standardized Latin square at random (these are tabulated) and then:

  1. randomly permute the columns,
  2. randomly permute the rows, and then
  3. assign the treatments to the Latin letters in a random fashion.

via https://onlinecourses.science.psu.edu/stat503/node/21

 

 

Advertisements

The illustrated guide to a Ph.D.

Every fall, I explain to a fresh batch of Ph.D. students what a Ph.D. is.

Imagine a circle that contains all of human knowledge:

By the time you finish elementary school, you know a little:

By the time you finish high school, you know a bit more:

With a bachelor’s degree, you gain a specialty:

A master’s degree deepens that specialty:

Reading research papers takes you to the edge of human knowledge:

Once you’re at the boundary, you focus:

You push at the boundary for a few years:

Until one day, the boundary gives way:

And, that dent you’ve made is called a Ph.D.:

Of course, the world looks different to you now:

So, don’t forget the bigger picture:

Keep pushing.

via http://matt.might.net/articles/phd-school-in-pictures/

Research Design: Qualitative, quantitative, and mixed methods approaches (強烈建議買第三版的),在我寫 proposal  的時候給我不少指引。

在這本書的第三章:Writing strategies and ethical considerations ,引用了 Maxwell (1996) 所提出的九個作研究的核心問題,我想這對初寫 proposal 的人應該很有幫助:
1. What do we need to better understand your topic?
2. What do we know little about in terms of your topic?
3. What do you propose to study?
4. What are the setting and the people that you will study?
5. What methods do you plan to use to provide data? 
6. How will you analyze the data?
7. How will you validate your findings?
8. What ethical issues will you study present?
9. What do preliminary results show about the practicability and the value of the proposed study?
一開始寫 proposal 不求多,只要花個兩到三頁的篇幅,回答上面這些問題,你就已經有一個很好的開始了。在回答這些問題與寫作的過程中,你會想得更多、更深,自然而然也就會愈寫愈多了。

經驗不足的學者經常花時間在說明很多早已成立的理論,老調重彈那些可以在其它地方找到的各種觀念、研究趨勢以及研究方法論,但是學術期刊和書籍的編輯們並不會讓這些菜鳥學者佔用刊物空間。

因為期刊的讀者往往有了一定的知識,重複介紹理論是不必要的。這節列出了撰寫序言可考慮的問題:

  1. 是否能用一句話表達本文目的為何?
  2. 文章傳達了什麼讓人意外的資訊?結果與期望是否相互矛盾?採訪對象曾說過讓人震撼或非常有趣的事情?我們的調查是否揭露了受訪者令人意想不到的態度?
  3. 讀者對此話題所持有的假設為何?這些假設對我們所提出的主題有多少幫助?
  4. 文章結尾是否有比目前序言表達更好的內容?
  5. 讀者是否已經沒有疑惑?或者,我們是否已經確定眼前這個結論就是真正的結論?

Publish,Don’t Perish! Resources
PROFESSIONALACADEMICWRITING
The Postgraduate’sGuide toGetting Published
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=857344
Academic Publishing forGraduate Students: a process guide
http://web.uvic.ca/spp/documents/acadpubforgradstudents.pdf
Editors’ Association of Canada: for professional editing services
http://www.editors.ca/hire/index.html
SFUStudent Learning Commons: Writing ResourcesforHonours andGraduate Students
http://learningcommons.sfu.ca/writing/graduate_students.php
THESISWRITING
“Dissertation Success Strategies”: University ofIllinois
http://www.couns.uiuc.edu/brochures/Dissertation.htm
Statement onGraduate Student Mentoring: LouisvilleUniversity
http://graduate.louisville.edu/pubs/mentor‐and‐graduate‐student‐strategies‐for‐success.html
TIMEMANAGEMENT
“Time Management” by theUniversity ofGuelph Learning Commons
http://www.learningcommons.uoguelph.ca/ByTopic/Learning/TimeManagement/index.html
University of MarylandUniversity College: creating a writing plan and projectschedule
http://www.umuc.edu/prog/ugp/ewp_writingcenter/writinggde/appendix_d/appendix_d‐02.shtml
“Writing and Presenting Your Thesis orDissertation” by S.Joseph Levine, Prof. Emeritus, Michigan State
University
http://www.learnerassociates.net/dissthes/
MUTUAL SUPPORT
TheDead Thesis Society: a Canadian grad studentsupport group
http://http‐server.carleton.ca/~felgar/dts/
“So long, and thanksforthe PhD”: a computerscience graduate schoolsurvival guide
http://www.cs.unc.edu/~azuma/hitch4.html
“Some Modest Advice forGraduate Students”: Dept. ofIntegrative Biology,Graduate StudentHandbook
http://www.anu.edu.au/BoZo/Scott/Cynicaladvice.html

T检验、F检验和统计学意义(P值或sig值)

1.T检验和F检验的由来

一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。

通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。

F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。统计显著性(sig)就是出现目前样本这结果的机率。

2. 统计学意义(P值或sig值)

结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的p值通常被认为是可接受错误的边界水平。

3. T检验和F检验

至於具体要检定的内容,须看你是在做哪一个统计程序。

举一个例子,比如,你要检验两独立样本均数差异是否能推论至总体,而行的t检验。
两样本(如某班男生和女生)某变量(如身高)的均数并不相同,但这差别是否能推论至总体,代表总体的情况也是存在著差异呢?
会不会总体中男女生根本没有差别,只不过是你那麼巧抽到这2样本的数值不同?
为此,我们进行t检定,算出一个t检定值。
与统计学家建立的以「总体中没差别」作基础的随机变量t分布进行比较,看看在多少%的机会(亦即显著性sig值)下会得到目前的结果。
若显著性sig值很少,比如<0.05(少於5%机率),亦即是说,「如果」总体「真的」没有差别,那麼就只有在机会很少(5%)、很罕有的情况下,才会出现目前这样本的情况。虽然还是有5%机会出错(1-0.05=5%),但我们还是可以「比较有信心」的说:目前样本中这情况(男女生出现差异的情况)不是巧合,是具统计学意义的,「总体中男女生不存差异」的虚无假设应予拒绝,简言之,总体应该存在著差异。

每一种统计方法的检定的内容都不相同,同样是t-检定,可能是上述的检定总体中是否存在差异,也同能是检定总体中的单一值是否等於0或者等於某一个数值。

至於F-检定,方差分析(或译变异数分析,Analysis of Variance),它的原理大致也是上面说的,但它是透过检视变量的方差而进行的。它主要用于:均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用、方差齐性(Equality of Variances)检验等情况。

4. T检验和F检验的关系

t检验过程,是对两样本均数(mean)差别的显著性进行检验。惟t检验须知道两个总体的方差(Variances)是否相等;t检验值的计算会因方差是否相等而有所不同。也就是说,t检验须视乎方差齐性(Equality of Variances)结果。所以,SPSS在进行t-test for Equality of Means的同时,也要做Levene’s Test for Equality of Variances 。

4.1
在Levene’s Test for Equality of Variances一栏中 F值为2.36, Sig.为.128,表示方差齐性检验「没有显著差异」,即两方差齐(Equal Variances),故下面t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。

4.2.
在t-test for Equality of Means中,第一排(Variances=Equal)的情况:t=8.892, df=84, 2-Tail Sig=.000, Mean Difference=22.99
既然Sig=.000,亦即,两样本均数差别有显著性意义!

4.3
到底看哪个Levene’s Test for Equality of Variances一栏中sig,还是看t-test for Equality of Means中那个Sig. (2-tailed)啊?
答案是:两个都要看。
先看Levene’s Test for Equality of Variances,如果方差齐性检验「没有显著差异」,即两方差齐(Equal Variances),故接著的t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。
反之,如果方差齐性检验「有显著差异」,即两方差不齐(Unequal Variances),故接著的t检验的结果表中要看第二排的数据,亦即方差不齐的情况下的t检验的结果。

4.4
你做的是T检验,为什么会有F值呢?
就是因为要评估两个总体的方差(Variances)是否相等,要做Levene’s Test for Equality of Variances,要检验方差,故所以就有F值。

另一种解释:

t检验有单样本t检验,配对t检验和两样本t检验。

单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。

配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。

F检验又叫方差齐性检验。在两样本t检验中要用到F检验。

从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t’检验或变量变换或秩和检验等方法。

其中要判断两总体方差是否相等,就可以用F检验。

若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。

简单来说就是实用T检验是有条件的,其中之一就是要符合方差齐次性,这点需要F检验来验证。
via http://blog.znsun.com/2008/04/653/t-test-and-f-test-and-p-or-sig-value

what_methods

如果你不知道什麼時候要用卡分檢定、T-test、Anova或Regression,但每一項的計算和原理你都清楚,那請你接著往下看,希望本文對你有幫助。

首先要談的是T-test。T檢定主要是檢驗兩組之間是否有差異(當然也有one sample t-test,不過較少使用),所以條件是有兩組只能有兩組。組別是類別變數(categorical variable),像是性別、種族、國籍。如果是連續變數,也可以設一個標準,多少以上是好的,以下是差的,以此來產生類別變數。如果超過兩組,必須用Anova來分析。另外,常犯的錯就是把前、後測是否有顯著差異用two-sample t-test來檢定,不能「假裝」把前測當一組,後測當一組,拿來做two-sample T檢定,而是應該用paired-sample t-test來檢驗是否有差異。

One-way Anova(單因子變異數分析)是只有一個類別變數當作independent variable,檢驗此類別變數與其它連續變數(continuous variable)和結果的關係。比方說如果你想看性別、IQ對數學成績的影響,性別就是類別變數,IQ是連續變數,數學成績是結果變數(outcome variable)。

Two-way Anova(雙因子變異數分析)是有兩個以上的類別變數作為independent variables。比如說性別、種族與IQ對數學成績的影響,性別和種族就是類別變數。

問題來了,什麼時候用Anova,什麼時候用Regression呢?這兩者有何不同?其實Anova就是(Linear) Regression不同點就在Anova裡面有類別變數而已。如果你跑ANOVA跟regression(當然跑regression會要用dummy variable),你會得到一樣的結果。換言之,Linear regression裡的變數均為連續變數或dummy variable,如:年齡、IQ、成績、體重等,沒有類別變數。如果想知道更多關於regression,可參考這篇:什麼是線性迴歸?(What is Multiple Linear Regression?) 。只要懂了這個,我覺得初、中級的統計,初、中級統計就沒什麼問題了。

最後說說卡方檢定(Chi-square)。先想想卡方檢定測的是什麼?對,是比例。那你可能會有問題,T-test與Anova比的是什麼呢?當然不是比例,而是平均的差異。卡方測的是一件事情,在各組發生的比例是否相同。在繼續說之前,要先記得,卡方檢定的變數不是連續變數,也不是ordinal variable,而是名目變數(nominal variables,又稱為categorical variable),也就是「是與否」、「男與女」這種變數。所以常見的問題就是:男女和素食行為,或是男女與是否有大學學歷等。

如果你已經弄糊塗了,可以參看下表
what_methods_1.png

what_methods_2.jpg
what_methods_3.jpg

最後要說一點,我不是統計系的,寫這個也只是說出自己的理解而已。如果有不對的地方,還歡迎網友指正。

2009/4/17 補充:
如果上面的分析還不夠清楚,你想要看「用哪種統計分析方式好」終極版(英文),請到這個網頁參考:http://www.ats.ucla.edu/stat/mult_pkg/whatstat/default.htm
2011/11/18修正:原本寫的是

「另外,常犯的錯就是把前、後測是否有顯著差異用T-test來檢定。即使有兩組,前、後測也不是用T-test來檢定的,更別說有人「假裝」把前測當一組,後測當一組,拿來做T檢定。」

這並不準確,現已修正為:

「另外,常犯的錯就是把前、後測是否有顯著差異用two-sample t-test來檢定,不能「假裝」把前測當一組,後測當一組,拿來做two-sample T檢定,而是應該用paired-sample t-test來檢驗是否有差異。」

生活在西班牙

自己动手丰衣足食

BlueAsteroid

Just another WordPress.com site

Jing's Blog

Just another WordPress.com site

Start from here......

我的心情魔方

天才遠私廚

希望能做一個分享各種資訊的好地方

语义噪声

西瓜大丸子汤的博客

笑对人生,傲立寰宇

Just another WordPress.com site

Where On Earth Is Waldo?

A Project By Melanie Coles

the Serious Computer Vision Blog

A blog about computer vision and serious stuff

Cauthy's Blog

paper review...

Cornell Computer Vision Seminar Blog

Blog for CS 7670 - Special Topics in Computer Vision

datarazzi

Life through nerd-colored glasses

Luciana Haill

Brainwaves Augmenting Consciousness

槑烎

1,2,∞

Dr Paul Tennent

and the university of nottingham

turn off the lights, please

A bunch of random, thinned and stateless thoughts around the Web