Hur används de, dem och dom i nutida skriftspråk? En storskalig korpusundersökning av nyheter och sociala medier
Nyckelord:
Swedish, large-scale corpus study, social media, personal pronoun, definite article, norm, spellingAbstract
This study ties in with a longstanding debate on the Swedish spelling variants de, dem and dom for personal pronouns (third person plural) and definite articles (plural). It charts the usage of de, dem and dom in five large corpora with news and social media texts over the past 25 years. The corpora contain more than 1.5 billion tokens, which rules out manual handling of the data. Instead, this study makes use of computational methods (including an AI language model) to automatically identify and classify relevant observations. Analysis of the news corpora shows a relatively stable usage of de, dem and dom over the past 25 years. The forms de and dem are predominantly used according to the norm: de for pronouns in subject position and as a definite article; dem for pronouns in object position. The colloquial form dom is hardly found in news texts. Analysis of the social media corpora shows more variation and change. The colloquial form dom is used in 5–25% of all instances instead of de or dem and has decreased after an initial rise. The forms de and dem are sometimes used in a non-standard way: de occurs in object position in 4–10% of the observations; dem is found in subject position or as a definite article in 1–7% of the cases. Non-standard dem is potentially on the rise with younger writers. The corpus analysis also provides details on the usage of de and dem in relative clauses, and on the users’ ratings of posts containing de, dem and dom on the social media platform Reddit.
Referenser
Berdicevskis, Aleksandrs, Coussé, Evie, Koplenig, Alexander, & Adesam, Yvonne, under utgivning: To drop or not to drop? Predicting the omission of the infinitival marker in a Swedish future construction. I: Corpus Linguistics and Linguistic Theory.
Birkebo, Henrik, 2016: Nu är det dags att slopa de och dem. I: Svenska Dagbladet. 2016-10-22.
Blythe, Richard & Croft, William, 2012: S-curves and the mechanisms of propagation in language change. I: Language 88(2). S. 269–304.
Borin, Lars, Forsberg, Markus & Roxendal, Johan, 2012: Korp – the corpus infrastructure of Språkbanken. I: Proceedings of LREC 2012. Istanbul: ELRA. S. 474–478.
Bylin, Maria & Melander, Björn, 2023: Språkrådet rekommenderar. Perspektiv, metoder och avvägningar i språkriktighetsfrågor. Stockholm: Språkrådet.
Börjeson, Love, Haffenden, Chris, Malmsten, Martin, Klingwall, Fredrik, Rende, Emma, Kurtz, Robin, Rekathati, Faton, Hägglöf, Hillevi & Sikora, Justyna, 2023: Transfiguring the Library as Digital Research Infrastructure: Making KBLab at the National Library of Sweden. SocArXiv preprint: doi:10.31235/osf.io/w48rf.
Cassirer, Peter, 1976: Formerna av pronomenet de i södra Sverige. I: Nysvenska studier 55–56. S. 251–290.
Ewerth, Sten, 1978: Ska dom eller skall de? I: Språkvård 1978(2). S. 25–30.
Ewerth, Sten, 1992: Tidningstexter, om dom igen. I: Språkvård 1992(3). S. 17–19.
Ewerth, Sten, 2008: Dom skriver fortfarande dem. I: Språktidningen 2008(6). S. 66–67.
Grünbaum, Catharina, 1976: Språknämndens enkät till svensklärare. I: Språkvård 1976 (4). S. 3–23.
Hallencreutz, Katharina, 1980: De-dem-dom i svenskt elevspråk. I: Kent Larsson (red.): Elevsvenska. (Ord och stil. Språkvårdssamfundets skrifter 12.) Lund: Studentlitteratur. S. 84–103.
Hammarstedt, Martin, Schumacher, Anne, Borin, Lars & Forsberg, Markus, 2022: Sparv 5 User Manual. Teknisk rapport.
Håkansson, Gisela & Norrby, Catrin, 2003: Vad kostar dem? I: Språkvård 2003(3). S. 11–16.
Karlsson, Susanna & Lind Palicki, Lena, 2017: Svensklärares upplevelser av besvärliga språkriktighetsfrågor. I: Emma Sköldberg, Maia Andréasson, Henrietta Adamsson Eryd, Filippa Lindahl, Sven Lindström, Julia Prentice & Malin Sandberg (red.): Svenskans beskrivning 35. Göteborg: Institutionen för svenska språket vid Göteborgs universitet. S. 93–106.
Lind Palicki, Lena & Karlsson, Susanna, 2019: Kan dagens elever verkligen inte skilja på de och dem? En granskning av elevers formvariation. I: Marco Bianchi, David Håkansson, Björn Melander, Linda Pfister, Maria Westman & Carin Östman (red.): Svenskans beskrivning 36. Uppsala: Institutionen för nordiska språk vid Uppsala universitet. S. 131–142.
Lind Palicki, Lena & Karlsson, Susanna, 2020: Till doms över dom. Och över dom andra. En språkideologisk analys av en språkvårdsdebatt. I: HumaNetten 44. S. 175–206.
Lind Palicki, Lena, 2022: Dags att vi skriver ’dom gamla husen’. I: Svenska Dagbladet. 2022-04-05.
Lövestam, Sara, 2022: ’Dom’ slår snart ut ’de’ och ’dem’. I: Svenska Dagbladet. 2022-02-22.
Malmsten, Martin, Börjeson, Love & Haffenden, Chris, 2020: Playing with Words at the National Library of Sweden – Making a Swedish BERT. arXiv preprint arXiv:2007.01658. https://arxiv.org/abs/2007.01658.
Medvedev, Alexey N., Lambiotte, Renaud & Delvenne, Jean-Charles, 2019: The anatomy of Reddit: An overview of academic research. I: F. Ghanbarnejad, R. Saha Roy, F. Karimi, J.-C. Delvenne & B. Mitra (red.): Dynamics On and Of Complex Networks III. DOOCN 2017. Springer Proceedings in Complexity. S. 183–204.
Molde, Bertil, 1971: Dom och andra talspråksformer. I: Språkvård 1971(2). S. 14–16.
Molde, Bertil, 1980: Ingen av de som? I: Språkvård 1980(4). S. 12–20.
Nevalainen, Terttu, 2015: Descriptive adequacy of the S-curve model in diachronic studies of language change. I: Christina Sanchez-Stockhammer (red.): Can We Predict Linguistic Change? (Studies in Variation, Contacts and Change in English 16.) Helsinki: VARIENG.
Phillips, Fred. 2007. On S-curves and tipping points. I: Technological Forecasting and Social Change 74(6). S. 715–730.
Platzack, Christer, 1976: Hur dom som blir de/dem som. I: Lars Svensson, Anne-Marie
Wieselgren & Åke Hansson (red.): Festskrift tillägnad Gösta Holm på 60-årsdagen den 8 juli 1976. Lund: Studentlitteratur. S. 353–361.
Rekathati, Faton, 2023: Deformer (Revision 83a43f2). https://huggingface.co/Lauler/ deformer.
Språktidningen & Språkrådet, 2021: Nyordslistan 2021. https://www.isof.se/lar-dig-mer/kunskapsbanker/lar-dig-mer-om-nyord/nyordslistor/nyordslistan-2021.
Svenska språknämnden, 2005: Språkriktighetsboken. Stockholm: Norstedts förlag.
Wiktorsson, Maria, 2018: How hybrid is blog data? A comparison between speech, writing and blog data in Swedish. I: Nordic Journal of Linguistics 41(3). S. 367–377.
Publicerad
Nummer
Sektion
Licens
Det här verket är licensierat under en Creative Commons Erkännande 4.0 Internationell-licens.
Författare som bidrar till Språk & stil har givit sitt medgivande att publicera sina artiklar under en Creative Commons-licens (Creative Commons CC-BY 4.0), vilket ger tredje part rätt att kopiera och återdistribuera materialet i vilket medium eller format som helst. Det ger också tredje part rätt att bearbeta, förändra och vidareutveckla materialet för vilket syfte som helst, inklusive kommersiellt, på villkor att tydligt erkännande ges till verkets upphovsperson, att en länk till licensen tillhandahålls och att det tydliggörs om ändringar av verket har gjorts. Detta ska göras på skäligt vis, och får ej förespegla att licensgivaren godkänner tredje part eller vederbörandes användning av verket. Författaren/författarna behåller copyright till verket.