A novel nonparametric measure of explained variation for survival data with an easy graphical interpretation

Ger Med Sci. 2015 Oct 29:13:Doc18. doi: 10.3205/000222. eCollection 2015.


Introduction: For survival data the coefficient of determination cannot be used to describe how good a model fits to the data. Therefore, several measures of explained variation for survival data have been proposed in recent years.

Methods: We analyse an existing measure of explained variation with regard to minimisation aspects and demonstrate that these are not fulfilled for the measure.

Results: In analogy to the least squares method from linear regression analysis we develop a novel measure for categorical covariates which is based only on the Kaplan-Meier estimator. Hence, the novel measure is a completely nonparametric measure with an easy graphical interpretation. For the novel measure different weighting possibilities are available and a statistical test of significance can be performed. Eventually, we apply the novel measure and further measures of explained variation to a dataset comprising persons with a histopathological papillary thyroid carcinoma.

Conclusion: We propose a novel measure of explained variation with a comprehensible derivation as well as a graphical interpretation, which may be used in further analyses with survival data.

Einleitung: Das Bestimmtheitsmaß kann bei Überlebenszeitdaten nicht verwendet werden um mithilfe einer Maßzahl anzugeben, wie gut ein Modell zu den vorliegenden Daten passt. Daher wurden in den letzten Jahren mehrere Maße der Erklärten Variation für Überlebenszeitdaten vorgeschlagen.Methoden: Wir analysieren eines dieser Maße der Erklärten Variation bezüglich gewisser Minimierungseigenschaften und zeigen, dass diese für das Maß nicht erfüllt sind.Ergebnisse: In Analogie zu der Kleinste-Quadrate-Methode aus der linearen Regression entwickeln wir ein neues Maß für kategorielle Kovariaten, welches nur auf dem Kaplan-Meier-Schätzer basiert. Dadurch ist das neue Maß komplett nichtparametrisch und besitzt eine einfache grafische Interpretation. Für das neue Maß stehen verschiedene Gewichtungsmöglichkeiten zur Verfügung und ein statistischer Signifikanztest kann angewendet werden. Abschließend bestimmen wir das neue Maß sowie weitere Maße der Erklärten Variation für die Personen eines Datensatzes mit einem histopathologisch gesicherten papillären Schilddrüsenkarzinom.Schlussfolgerung: Wir schlagen ein neues Maß der Erklärten Variation mit einer eingängigen Herleitung sowie einer grafischen Interpretation vor, welches bei künftigen Auswertungen von Überlebenszeitdaten verwendet werden könnte.

Keywords: explained variation; nonparametric; novel measure; survival data; test of significance.

MeSH terms

  • Analysis of Variance*
  • Data Interpretation, Statistical
  • Humans
  • Kaplan-Meier Estimate*
  • Models, Statistical*
  • Statistics, Nonparametric
  • Thyroid Neoplasms / mortality*