Lecture_7_part2_phylogenetics

Lecture_7_part2_phylogenetics - Least Squares Distance...

Info iconThis preview shows pages 1–3. Sign up to view the full content.

View Full Document Right Arrow Icon
9/24/13’ 1’ Least’Squares’Distance’Phylogeny’Problem’ If’the’distance’matrix’ D ’is NOT addi(ve ,’then’we’look’for’a’tree’ T that’approximates’ D ’the’best:’ Squared Error ’:’ i,j ’( d ij (T)’–’ D ij ) 2’ Squared’Error’is’a’measure’of’the’quality’of’the’Ft’between’ distance’matrix’and’the’tree:’we’want’to’minimize’it.’ Least Squares Distance Phylogeny Problem :’Fnding’the’best’ approximaJon’tree’ T ’for’a’non-addiJve’matrix’ D’( NP-hard).’ 58’ Unweighted’Pair’Group’Method’using’ ArithmeJc’Averages’(UPGMA)’ UPGMA’is’a’type’of’ Distance-Based’algorithm ,’that’is’one’of’the’ simplest’and’most’intuiJve’methods’ UPGMA’is’a’clustering’algorithm’that:’ computes’the’distance’between’clusters’using’average’ pairwise’distance’ assigns’a’ height ’to’every’vertex’in’the’tree,’e±ecJvely’ assuming’the’presence’of’a’molecular’clock’and’daJng’every’ vertex’ Thus,’the’tree’can’be’imagined’as’being’assembled’upwards,’ each’node’being’added’above’the’others,’and’the’edge’lengths’ being’determined’by’the’di±erence’in’the’heights’of’the’nodes’at’ the’top’and’boYom’of’an’edge.’ 59’ An’Example’of’UPGMA’ 60’ An’Example’of’UPGMA’ 61’ An’Example’of’UPGMA’ 62’ An’Example’of’UPGMA’
Background image of page 1

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full Document Right Arrow Icon
9/24/13’ 2’ 63’ An’Example’of’UPGMA’ 64’ UPGMA’Clustering’ Let’ C i ’and’ j ’be’clusters,’deFne’distance’between’them’to’be’ When’we’combine’two’cluster,’ ’and’ ,’to’form’a’new’cluster’ k ,’then’ DeFne’a’node’K’and’place’its’children’nodes’at’depth’ d(C i , C j )/2 ∑∑ = p q d 1 ) , ( | || | ) , ( | | | | ) , ( | | ) , ( | | ) , ( j i l j j l i i l k C C C C d C C C d C C C d + + = 65’ Another’Example’ UPGMA’construcJon’on’Fve’species.’The’length’of’an’ edge’is’equal’to’its’(verJcal)’height . 2’ 3’ 4’ 1’ 6’ 8’ 9’ d (7,8) / 2 5’ 7’ d (2,3) / 2 UPGMA s’Weakness’ The’algorithm’produces’an’ ultrametric ’tree’:’ the’distance’from’the’root’to’any’leaf’is’the’ same’ UPGMA’assumes’a’constant’molecular’ clock:’all’species’represented’by’the’leaves’ in’the’tree’are’assumed’to’accumulate’ mutaJons’(and’thus’evolve)’at’the’same’ rate.’This’is’a’major’pi±alls’of’UPGMA.’ UPGMA s’Weakness:’Example’ 2’ 3’ 4’ 1’ 1’ 4’ 3’ 2’ Correct’tree’ UPGMA’ 68’ Three’Methods’of’Tree’ConstrucJon’ Distance:’a’tree’that’recursively’combines’two’ nodes’of’the’smallest’distance.’
Background image of page 2
Image of page 3
This is the end of the preview. Sign up to access the rest of the document.

{[ snackBarMessage ]}

Page1 / 8

Lecture_7_part2_phylogenetics - Least Squares Distance...

This preview shows document pages 1 - 3. Sign up to view the full document.

View Full Document Right Arrow Icon
Ask a homework question - tutors are online