Centron Tutorials – Expertenwissen für Cloud-Technologien und IT-Infrastruktur (2024)

Sie können die Stichprobenquantile mit der Funktion quantile() in R erzeugen.

Hallo Leute, heute werden wir uns anschauen, wie man die Quantile der Werte mit der Funktion quantile() findet.

Quantil: In Laienbegriffen ist ein Quantil nichts anderes als eine Stichprobe, die in gleich große Gruppen oder Größen aufgeteilt ist. Aufgrund dieser Eigenschaft werden die Quantile auch als Fraktile bezeichnet. Bei den Quantilen wird das 25. Perzentil als unteres Quartil, das 50. Perzentil als Median und das 75. Perzentil als oberes Quartil bezeichnet.

In den folgenden Abschnitten sehen wir uns an, wie diese Quantile()-Funktion in R funktioniert.

Syntax der Quantile()-Funktion

Die Syntax der Quantile()-Funktion in R lautet:

quantile(x, probs = , na.rm = FALSE)

Wo,

  • X = der Eingabevektor oder die Werte
  • Probs = Wahrscheinlichkeiten der Werte zwischen 0 und 1.
  • na.rm = entfernt die NA-Werte.

Eine einfache Implementierung der Quantile()-Funktion in R

Nun, ich hoffe, Sie sind mit der Definition und den Erklärungen zur Quantilfunktion vertraut. Jetzt sehen wir uns an, wie die Quantilfunktion in R mit Hilfe eines einfachen Beispiels funktioniert, das die Quantile für die Eingabedaten zurückgibt.

#creates a vector having some values and the quantile function will return the percentiles for the data.df<-c(12,3,4,56,78,18,46,78,100)quantile(df)Output:0% 25% 50% 75% 100%3 12 46 78 100

In der obigen Stichprobe können Sie beobachten, dass die Quantile-Funktion zuerst die Eingabewerte in aufsteigender Reihenfolge anordnet und dann die erforderlichen Perzentile der Werte zurückgibt.

Hinweis: Die Quantilfunktion teilt die Daten in zwei gleiche Hälften, wobei der Median in der Mitte liegt und darüber der untere Teil als unteres Quartil und der obere Teil als oberes Quartil bezeichnet wird.

Umgang mit fehlenden Werten – ‘NaN’

NaNs sind überall. In dieser datengetriebenen digitalen Welt begegnen Sie diesen NaNs häufiger, die oft als fehlende Werte bezeichnet werden. Wenn Ihre Daten auf irgendeine Weise diese fehlenden Werte enthalten, können Sie am Ende NaNs in der Ausgabe oder Fehler in der Ausgabe bekommen.

Um diese fehlenden Werte zu behandeln, verwenden wir die na.rm-Funktion. Diese Funktion entfernt die NA-Werte aus unseren Daten und gibt die wahren Werte zurück.

Lassen Sie uns sehen, wie das funktioniert.

#creates a vector having values along with NaN'sdf<-c(12,3,4,56,78,18,NA,46,78,100,NA)quantile(df)Output:Error in quantile.default(df) :missing values and NaN's not allowed if 'na.rm' is FALSE

Oh, wir haben einen Fehler erhalten. Wenn Ihre Vermutung die NA-Werte betrifft, sind Sie absolut klug. Wenn NA-Werte in unseren Daten vorhanden sind, enden die meisten Funktionen damit, die NA-Werte selbst oder die oben genannte Fehlermeldung zurückzugeben.

Nun, entfernen wir diese fehlenden Werte mit der na.rm-Funktion.

#creates a vector having values along with NaN'sdf<-c(12,3,4,56,78,18,NA,46,78,100,NA)#removes the NA values and returns the percentilesquantile(df,na.rm = TRUE)Output:0% 25% 50% 75% 100%3 12 46 78 100

In der obigen Stichprobe können Sie die na.rm-Funktion und ihre Auswirkungen auf das Ergebnis sehen. Die Funktion entfernt die NAs, um falsche Ergebnisse zu vermeiden.

Das ‘Probs’-Argument in der Quantile

Wie Sie das Probs-Argument in der Syntax sehen können, das im ersten Abschnitt des Artikels vorgestellt wurde, fragen Sie sich vielleicht, was es bedeutet und wie es funktioniert. Nun, das Probs-Argument wird an die Quantile-Funktion übergeben, um die spezifischen oder benutzerdefinierten Perzentile zu erhalten.

Scheint kompliziert? Keine Sorge, ich werde es in einfache Begriffe zerlegen.

Immer wenn Sie die Funktion Quantile verwenden, gibt sie die Standardperzentile wie 25, 50 und 75 Perzentile zurück. Aber was ist, wenn Sie das 47. Perzentil oder vielleicht das 88. Perzentil wollen?

Dann kommt das Argument ‘Probs’ ins Spiel, in dem Sie die gewünschten Perzentile angeben können.

Bevor wir zum Beispiel gehen, sollten Sie einige Dinge über das Probs-Argument wissen.

Probs: Das Probs- oder Wahrscheinlichkeitsargument sollte zwischen 0 und 1 liegen.

Hier ist eine Stichprobe, die die obige Aussage veranschaulicht.

#creates the vector of valuesdf<-c(12,3,4,56,78,18,NA,46,78,100,NA)#returns the quantile of 22 and 77 th percentiles. quantile(df,na.rm = T,probs = c(22,77))Output:Error in quantile.default(df, na.rm = T, probs = c(22, 77)) : 'probs' outside [0,1]

Oh, es ist ein Fehler!

Haben Sie verstanden, was passiert ist?

Hier kommt die Probs-Aussage. Obwohl wir die richtigen Werte im Probs-Argument angegeben haben, verletzt es die 0-1-Bedingung. Das Probs-Argument sollte Werte enthalten, die zwischen 0 und 1 liegen.

Also müssen wir die Probs 22 und 77 in 0,22 und 0,77 umwandeln. Jetzt liegen die Eingabewerte zwischen 0 und 1, richtig? Ich hoffe, das ergibt Sinn.

#creates a vector of valuesdf<-c(12,3,4,56,78,18,NA,46,78,100,NA)#returns the 22 and 77th percentiles of the input valuesquantile(df,na.rm = T,probs = c(0.22,0.77))Output: 22% 77% 10.08 78.00 

Die ‘Unname’-Funktion und ihre Verwendung

Angenommen, Sie möchten, dass Ihr Code nur die Perzentile zurückgibt und die Schnittpunkte vermeidet. In diesen Situationen können Sie die ‘unname’-Funktion verwenden.

Die ‘unname’-Funktion entfernt die Überschriften oder Schnittpunkte (0%, 25%, 50%, 75%, 100%) und gibt nur die Perzentile zurück.

Lassen Sie uns sehen, wie es funktioniert!

#creates a vector of valuesdf<-c(12,3,4,56,78,18,NA,46,78,100,NA)quantile(df,na.rm = T,probs = c(0.22,0.77))#avoids the cut-points and returns only the percentiles.unname(quantile(df,na.rm = T,probs = c(0.22,0.77)))Output:10.08 78.00

Jetzt können Sie beobachten, dass die Schnittpunkte durch die Unname-Funktion deaktiviert oder entfernt wurden und nur die Perzentile zurückgegeben werden.

Die ‘round’-Funktion und ihre Verwendung

Wir haben die Round-Funktion in R bereits in einem früheren Artikel ausführlich besprochen. Jetzt werden wir die Round-Funktion verwenden, um die Werte abzurunden.

Lassen Sie uns sehen, wie das funktioniert!

#creates a vector of valuesdf<-c(12,3,4,56,78,18,NA,46,78,100,NA)quantile(df,na.rm = T,probs = c(0.22,0.77))#returns the round off valuesunname(round(quantile(df,na.rm = T,probs = c(0.22,0.77))))Output:10 78

Wie Sie sehen können, sind unsere Ausgabewerte auf null Dezimalstellen gerundet.

Die Quantile für mehrere Gruppen/Spalten in einem Datensatz erhalten

Bis jetzt haben wir die Quantile-Funktion, ihre Verwendung und Anwendungen sowie ihre Argumente und deren korrekte Verwendung besprochen.

In diesem Abschnitt werden wir die Quantile für mehrere Spalten in einem Datensatz erhalten. Klingt interessant? Folgen Sie mir!

Ich werde den ‘mtcars’-Datensatz für diesen Zweck verwenden und auch die ‘dplyr’-Bibliothek dafür nutzen.

#reads the datadata("mtcars")#returns the top few rows of the datahead(mtcars)#install required paclagesinstall.packages('dplyr')library(dplyr)#using tapply, we can apply the function to multiple groupsdo.call("rbind",tapply(mtcars$mpg, mtcars$gear, quantile))Output: 0% 25% 50% 75% 100%3 10.4 14.5 15.5 18.400 21.54 17.8 21.0 22.8 28.075 33.95 15.0 15.8 19.7 26.000 30.4

Im obigen Prozess müssen wir das ‚dplyr’-Paket installieren und dann die tapply- und rbind-Funktionen verwenden, um die mehreren Spalten der mtcars-Datensätze zu erhalten.

Im obigen Abschnitt haben wir mehrere Spalten wie ‘mpg’ und die ‘gear’-Spalten im mtcars-Datensatz genommen. So können wir die Quantile für mehrere Gruppen in einem Datensatz berechnen.

Können wir die Perzentile visualisieren?

Meine Antwort ist ein großes JA!. Das beste Diagramm dafür wäre ein Boxplot. Lassen Sie mich den Iris-Datensatz nehmen und versuchen, den Boxplot zu visualisieren, der die Perzentile ebenfalls darstellt.

Lassen Sie uns beginnen!

data(iris)head(iris)

Centron Tutorials – Expertenwissen für Cloud-Technologien und IT-Infrastruktur (1)

Dies ist der Iris-Datensatz mit den obersten 6 Werten.

Lassen Sie uns die Daten mit der Funktion namens – ‘Summary’ erkunden.

summary(iris)

Centron Tutorials – Expertenwissen für Cloud-Technologien und IT-Infrastruktur (2)

Im obigen Bild können Sie den Mittelwert, Median, 25. Perzentil (1. Quartil), 75. Perzentil (3. Perzentil) sowie die Min- und Max-Werte sehen. Lassen Sie uns diese Informationen durch einen Boxplot darstellen.

Lassen Sie uns das tun!

#plots a boxplot with labelsboxplot(iris$Sepal.Length, main='The boxplot showing the percentiles', col='Orange', ylab='Values', xlab='Sepal Length', border = 'brown', horizontal = T)

Centron Tutorials – Expertenwissen für Cloud-Technologien und IT-Infrastruktur (3)

Ein Boxplot kann viele Aspekte der Daten zeigen. In der untenstehenden Abbildung habe ich die speziellen Werte erwähnt, die durch die Boxplots dargestellt werden. Das wird Ihnen Zeit sparen und Ihr Verständnis auf bestmögliche Weise erleichtern.

Centron Tutorials – Expertenwissen für Cloud-Technologien und IT-Infrastruktur (4)

Quantile() Funktion in R – Zusammenfassung

Nun, das ist ein längerer Artikel, wie ich vermute. Und ich habe mein Bestes gegeben, um die Quantile()-Funktion in R in mehreren Dimensionen durch verschiedene Beispiele und Illustrationen zu erklären und zu erforschen. Die Quantile-Funktion ist die nützlichste Funktion in der Datenanalyse, da sie effizient mehr Informationen über die gegebenen Daten offenbart.

Ich hoffe, Sie haben ein gutes Verständnis für die Aufregung rund um die Quantile()-Funktion in R erlangt. Das ist alles für jetzt. Wir werden mit immer mehr schönen Funktionen und Themen in der R-Programmierung zurückkommen. Bis dahin passen Sie auf sich auf und viel Spaß bei der Datenanalyse!!! Quantile() Funktion in R –UnverzichtbarerLeitfaden

Centron Tutorials – Expertenwissen für Cloud-Technologien und IT-Infrastruktur (2024)
Top Articles
How to Make a Simple White Sauce
Homemade Korean BBQ Sauce
ARK Survival Ascended Floating Turret Tower Build Guide
Incredibox Deluxe
Honda Odyssey Questions - P0303 3 cyclinder misfire
Treasure Hunt Deals Racine Wi
Temu Beanies
Erhöhte Gesundheitsgefahr durch Zuckeraustauschstoff Erythrit?
Google Sites 1V1.Lol
Kutty Movie Net
Teacup Yorkie For Sale Up To $400 In South Carolina
Lebron Vs Pacers Stats
Ta Travel Center Las Cruces Photos
5 Best Vanilla Vodka co*cktails
Paperless Pay.talx/Nestle
Gamma-glutamyl Transferase (GGT) Test: MedlinePlus Medical Test
Sandra Sancc
Upper Rank Demons Wiki
Albany Want Ad Digest
Karz Insurance Quote
309 Marshall Passage
Ip Address Issue Nad 3303
Garagesalefinder Com
Elmira Star Gazette Obit
Wharton Funeral Home Wharton Tx
Kagtwt
Starter Blocked Freightliner Cascadia
Ok Google Zillow
Owyhee County Extension Office
Bolly2Tolly Sale
Helas Kitchen Menu
Craigslist In Visalia California
Best Upscale Restaurants In Denver
What Auto Parts Stores Are Open
Charlotte North Carolina Craigslist Pets
Horoscope Today: Astrological prediction September 9, 2024 for all zodiac signs
No title - PDF Free Download
Sydney V May Of Leaked
Holy Grail Cum Guide
Nature's Medicine Uxbridge Menu
Ihop Ralph Ave
Kytty_Keeet
Game On Classroom 6X
Palmetto Pediatrics Westside
10.4: The Ideal Gas Equation
Sound Of Freedom Showtimes Near Wellborne Cinema
Swoop Amazon S3
Leader of multi-state identity fraud ring sentenced to federal prison
Was genau ist eine pillow princess?
Can You Change Your Breathing Style In Demonfall
Randstad Westside
Navy Qrs Supervisor Answers
Latest Posts
Article information

Author: Annamae Dooley

Last Updated:

Views: 5889

Rating: 4.4 / 5 (45 voted)

Reviews: 92% of readers found this page helpful

Author information

Name: Annamae Dooley

Birthday: 2001-07-26

Address: 9687 Tambra Meadow, Bradleyhaven, TN 53219

Phone: +9316045904039

Job: Future Coordinator

Hobby: Archery, Couponing, Poi, Kite flying, Knitting, Rappelling, Baseball

Introduction: My name is Annamae Dooley, I am a witty, quaint, lovely, clever, rich, sparkling, powerful person who loves writing and wants to share my knowledge and understanding with you.