Muster für die berechnung der grz

In einigen Kontexten möchten wir die Wahrscheinlichkeit berechnen können, dass ein Mitglied einer Klasse von Mustern auf einem Baum entstehen würde. Waddell et al.2 führten beispielsweise eine Methode zur Beurteilung der Angemessenheit eines Substitutionsmodells in der Phylogenetik ein. Sie stellten fest, dass Tests der Modelladäquanz, die von Reeves3 und Goldman45 eingeführt wurden, oft keine Leistung haben, insbesondere für Datensätze mit einer großen Anzahl von Sequenzen. Diese Tests verwenden eine Wahrscheinlichkeits-Ratio-Teststatistik, um die Wahrscheinlichkeit der Daten unter einem phylogenetischen Modell mit der Wahrscheinlichkeit der Daten unter einem “unbeschränkten”, multinomialen Modell zu vergleichen. Das Multinom-Modell hat einen freien Parameter für jedes mögliche Datenmuster. Die Wahrscheinlichkeit unter diesem nicht eingeschränkten Modell ist eine Obergrenze für die Wahrscheinlichkeit für jedes Modell unabhängiger Standorte4, da das nicht eingeschränkte Modell perfekt mit der relativen Häufigkeit jedes beobachteten Musters übereinstimmen kann. In diesen Tests ergibt sich der inhärente Mangel an Kraft aus der enormen Anzahl freier Parameter im Multinom-Modell. Die Anzahl der möglichen Muster wächst exponentiell mit der Anzahl der Spitzen im Baum. Da jedes der N-Blätter einen der K-Zustände annehmen kann, gibt es KN-mögliche Muster.

Das Multinom-Modell macht keine Einschränkung für die erwarteten Frequenzen (außer dass sie auf 1 summieren), so dass KN-1 freie Parameter im Modell vorhanden sind. Damit der Test feststellen kann, dass das phylogenetische Modell unzureichend ist, muss die mit dem unbeschränkten Modell verbundene Wahrscheinlichkeitsverbesserung groß genug sein, um die erhebliche Strafe für die Überparameterisierung zu überwinden, die mit dieser sehr großen Anzahl freier Parameter einhergeht. Sie finden den Quellcode auf GitHub. Die Lösung der Probleme ist das Strategiemuster. “Sagen Sie, Sie wollen eine Linse, die gut für mehrere verschiedene Farben funktioniert, oder Sie wollen Licht nehmen und anstatt es auf einen Punkt zu fokussieren, machen Sie einen Strahl oder eine Art Hologramm oder optische Falle”, sagt Johnson. “Sie können uns sagen, was Sie tun möchten, und diese Technik kann mit dem Muster kommen, das Sie machen sollten.” Eine einzelne Metaoberfläche ist in der Regel in winzige, nanometergroße Pixel unterteilt. Jedes Pixel kann entweder geätzt oder unberührt bleiben. Diejenigen, die geätzt sind, können zu einer beliebigen Anzahl unterschiedlicher Muster zusammengesetzt werden.

Felsensteins Beschnittalgorithmus ermöglicht es, die Wahrscheinlichkeit eines bestimmten Datenmusters zu berechnen, das auf einer Phylogenie entsteht, wenn man ein Modell der Charakterentwicklung anführt. Hier stellen wir einen ähnlichen dynamischen Programmieralgorithmus vor. Unser Algorithmus behandelt den Baum und das Modell als bekannt. Der Algorithmus macht es möglich, die Wahrscheinlichkeit zu berechnen, dass ein zufällig ausgewähltes Zeichen Mitglied einer bestimmten Klasse von Zeichenmustern ist. Insbesondere sind wir daran interessiert, Muster durch die Anzahl der Parsimony-Schritte und die Reihe von Zuständen, die an den Spitzen des Baumes beobachtet werden, zu binning. Dieser Algorithmus wurde entwickelt, um den Bereich der Datensatzgrößen zu erweitern, die mit dem marginalen Testansatz von Waddell et al. zur Beurteilung der Angemessenheit eines Modells verwendet werden können. Die eingeführten Algorithmen können auch in Wahrscheinlichkeitsberechnungen verwendet werden, die für die Feststellungsverzerrungen korrigieren.

Lewis hat beispielsweise ein Mkv-Modell eingeführt, das das Fehlen konstanter Standorte korrigiert. Die Wahrscheinlichkeit, dass ein konstantes Muster entsteht, kann mit dem von uns vorliegenden Algorithmus oder durch Aufzählung aller möglichen konstanten Muster und Berechnung der Wahrscheinlichkeit jedes einzelnen berechnet werden. Da die Anzahl der konstanten Datenmuster klein ist, sind beide Methoden effizient. Die Ausarbeitung des Mkv-Modells (wie die in Nylander et al.) erfordert jedoch die Berechnung der Wahrscheinlichkeit von parsimony-uninformativen Mustern, die entstehen. Bei großen Bäumen und Charakteren mit vielen möglichen Charakterzuständen ist die Anzahl möglicher parismony-uninformativer Muster immens. In diesen Fällen werden die hier vorgestellten Algorithmen effizienter sein. Der Algorithmus wurde in Open-Source-Software in C++ geschrieben implementiert.