Archiv verlassen und diese Seite im Standarddesign anzeigen : Literatur Culturomics – Studie über die Häufigkeit von Wörtern
drunken monkey
18.12.2010, 14:18
Culturomics (http://www.culturomics.org/)
Ist ein Projekt bei dem aus von Google eingescannten Büchern die Häufigkeit einzelner Wörter im Verlauf der Zeit (mehrere hundert Jahre an Material) bestimmt wurde. Dazu gibt's nicht nur einen Artikel, man kann das Ganze auch selber ausprobieren! :D Außerdem sind nicht nur englische Daten verfügbar, sondern unter anderem auch deutsche – ingesamt imo eine ganz witzige Sache, kann man sich doch ganz gut damit rumspielen. ^^
Was ich schon bemerkt habe: Erwartungsgemäß ist die Verwendung von Thursday, Next (http://ngrams.googlelabs.com/graph?content=Thursday%2CNext&year_start=1970&year_end=2008&corpus=0&smoothing=3) und vor allem Thursday Next (http://ngrams.googlelabs.com/graph?content=Thursday+Next&year_start=1970&year_end=2008&corpus=0&smoothing=3) in den letzten paar Jahren sprunghaft angestiegen. XD
Sowas wie Nahrungsmittel im Verlauf der Zeit (http://ngrams.googlelabs.com/graph?content=steak%2Csausage%2Cice+cream%2Chamburger%2Cpizza%2Cpasta%2Csushi%2Cporridge&year_start=1800&year_end=2000&corpus=0&smoothing=3) ist aber auch ganz witzig. :D Vor allem ist da imo erstaunlich, dass sich die Häufigkeit im Gesamten da extrem gesteigert hat. o_O
Ahja, und für die Programmierer unter uns kann man sich die Datensätze auch komplett runterladen und selber was daraus basteln. :D
La Cipolla
09.01.2011, 13:16
Ich finds generell ziemlich geil. :D ...kriege es aber irgendwie nicht hin, selbst nach Wörtern zu suchen (wtf?).
Und erklär mir mal das mit Thursday bitte, ich kapiers nicht. ^^
Ich finds generell ziemlich geil. :D ...kriege es aber irgendwie nicht hin, selbst nach Wörtern zu suchen (wtf?).Klick einfach auf den Thursday Link und ersetze das Wort oben. Auf der Seite selbst finde ich auch nicht hin, muss man aber auch nicht =D
Oder nimm halt das hier (http://ngrams.googlelabs.com/graph?content=&year_start=1970&year_end=2008&corpus=0&smoothing=3)
Eine lustige Sache ist es allemal =D
La Cipolla
09.01.2011, 13:37
Danke!
Ist wirklich unglaublich interessant für die Soziologie behaupte ich mal.
"German" ist im Englischen zunehmend out (http://ngrams.googlelabs.com/graph?content=German&year_start=1970&year_end=2008&corpus=0&smoothing=3), aber "Russian" geht es auch nicht viel besser (http://ngrams.googlelabs.com/graph?content=Russian&year_start=1970&year_end=2008&corpus=0&smoothing=3). Haben wohl beide den Frieden nicht so gut verkraftet. :p Im Deutschen dagegen ist "Volk" einer der großen Verlierer (http://ngrams.googlelabs.com/graph?content=Volk&year_start=1970&year_end=2008&corpus=8&smoothing=3), was ich unterhaltsam finde. :D
drunken monkey
09.01.2011, 14:39
Und erklär mir mal das mit Thursday bitte, ich kapiers nicht. ^^
Thursday Next ist die Protagonistin einer (genialen) Romanserie von Jasper Fforde, daher der Anstieg rund um 2000. XD
Und so deutlich ist er (zumindest bei "next"), wie ich jetzt bemerkt habe, weil das ganze case-sensitive ist. Und dass "next" normal nicht so oft groß geschrieben wird, ist ja irgendwie klar …
Auf der Seite selbst finde ich auch nicht hin, muss man aber auch nicht =D
Man klicke auf der verlinkten Seite einfach auf "Explore Cultural Trends @ Google Labs". ^^" Aber ja, durch meine Beispiele findet man ja sowieso hin …
Mordechaj
09.01.2011, 15:11
Im Deutschen dagegen ist "Volk" einer der großen Verlierer (http://ngrams.googlelabs.com/graph?content=Volk&year_start=1970&year_end=2008&corpus=8&smoothing=3), was ich unterhaltsam finde. :D
Ich hab's zuerst mit "Parterre" (http://ngrams.googlelabs.com/graph?content=Parterre&year_start=1970&year_end=2008&corpus=8&smoothing=3) und "Erdgeschoss" (http://ngrams.googlelabs.com/graph?content=Erdgeschoss&year_start=1970&year_end=2008&corpus=8&smoothing=3) probiert, aber das ist auch ziemlich gut.
Liferipper
09.01.2011, 17:22
Faszinierend... (http://ngrams.googlelabs.com/graph?content=Hass&year_start=1900&year_end=2008&corpus=8&smoothing=3)
drunken monkey
09.01.2011, 18:39
Faszinierend... (http://ngrams.googlelabs.com/graph?content=Hass&year_start=1900&year_end=2008&corpus=8&smoothing=3)
Woah, das ist irgendwie beunruhigend … o_O"
Faszinierend... (http://ngrams.googlelabs.com/graph?content=Hass&year_start=1900&year_end=2008&corpus=8&smoothing=3)Cool das wir die Schwelle des prozentualen Hasses schon weit überschritten haben und noch keinen Weltkrieg ausgelöst haben.
Ich glaube kaum, dass die Literatur über die Jahrzehnte hinweg gleichmäßig repräsentiert ist, und selbst wenn das der Fall wäre, müsste man das unterschiedliche Volumen der Buchproduktion irgendwie noch berücksichtigen.
drunken monkey
11.01.2011, 23:31
Ich glaube kaum, dass die Literatur über die Jahrzehnte hinweg gleichmäßig repräsentiert ist, und selbst wenn das der Fall wäre, müsste man das unterschiedliche Volumen der Buchproduktion irgendwie noch berücksichtigen.
Naja, da die Angaben ja überall in Prozent sind, macht das bloße Volumen keinen Unterschied.
Dass sich die Zusammensetzung des Anteils, der erfasst wurde, über die Zeit ändert, kann allerdings schon sein, da hast du recht … Aber soll ja auch keine harte Wissenschaft sein, und im Allgemeinen werden die Sachen schon recht gut hinhauen.
Die Moderne Literatur (http://ngrams.googlelabs.com/graph?content=ficken&year_start=1840&year_end=2000&corpus=8&smoothing=2)
Es mag etwas kindisch sein, aber... diese Statistiken sind einfach nur interessant. :D
Oder der (möglicherweise) nach mehreren Jahrhunderten wieder ansteigende Aberglaube...? (http://ngrams.googlelabs.com/graph?content=devil&year_start=1840&year_end=2010&corpus=0&smoothing=2)
E D I T :
Tod (http://ngrams.googlelabs.com/graph?content=Tod&year_start=1500&year_end=2008&corpus=8&smoothing=50) groß geschrieben
tod (http://ngrams.googlelabs.com/graph?content=tod&year_start=1500&year_end=2008&corpus=8&smoothing=50) klein geschrieben.
???
Das bringt Zweifel bei mir auf, denn alles was man klein schreibt, zeigt diese Stufen in der Zeitspanne, die so irgendwie sehr unrealitisch wirken.
Das selbe passiert bei jeder Art von Wort die man eintippt.
http://ngrams.googlelabs.com/graph?content=Manga,+Anime&year_start=1840&year_end=2000&corpus=8&smoothing=2
Manga ok, aber Anime? Gab es mal irgendeine andere Bedeutung des Wortes? Ich zweifle einfach mal leicht daran, dass man schon in der Märzrevolution Anime geschaut hat.
Whiz-zarD
12.01.2011, 10:06
Baumharz wurde im Mittelalter auch Anime genannt.
Mein Lieblingswort (http://ngrams.googlelabs.com/graph?content=sintemal&year_start=1900&year_end=2008&corpus=8&smoothing=3), das leider immer weiter aus der Mode kommt. :\
Powered by vBulletin® Version 4.2.3 Copyright ©2025 Adduco Digital e.K. und vBulletin Solutions, Inc. Alle Rechte vorbehalten.