1. INTRODUCTION
Le discours électronique offre un terrain fertile pour l’exploration de la transposition du vernaculaire à l’écrit. McCulloch (Reference McCulloch2019) résume ainsi les nouvelles pratiques langagières de l’internet : «We write all the time now, and most of what we’re writing is informal : our texts and chats and posts are quick, they’re conversational, they’re untouched by the hands of an editor.» (McCulloch Reference McCulloch2019 : 2).Footnote 1 Le numéro thématique duquel cet article est issu vise à faire le point sur la variation en français telle qu’elle se manifeste dans le discours électronique en s’appuyant sur diverses sources de données provenant de corpus de messages textes, de clavardage ou encore de différentes plateformes médiatiques comme Twitter. Chacune de ces sources de données renvoie à une écologie linguistique particulière qui mérite l’attention. Alors que les gazouillis publiés sur Twitter sont conçus pour être lus par un grand nombre et que le clavardage renvoie à des communautés de pratique particulières, les textos sont généralement réservés à une communication dialogique entre proches (Tremblay, Reference Tremblay2020). De nouveaux codes inspirés de l’oral viennent suppléer l’écrit standard, qui apparaît inadéquat ou insuffisant dans ce contexte. Comme nous allons le démontrer, le caractère de proximité associé au texto en fait un lieu d’observation idéal pour examiner l’écriture du vernaculaire et ouvre la voie aux études sur la sociolinguistique de l’écrit. En outre, ces pratiques langagières émergentes, empreintes d’oralité, permettent d’étudier le vernaculaire en contexte naturel et, puisque les participants prennent part à des échanges authentiques sans la présence d’un observateur ou d’un interviewer comme dans les entrevues semi-dirigées, l’observation de ces pratiques peut être envisagée comme une des façons de résoudre le paradoxe de l’observateur (Labov, Reference Labov1972: 209).
Contrairement au français écrit normé qui, codifié au 17ème, répond à des normes institutionnelles (école, l’Académie française, l’Office québécois de la langue française, dictionnaires, grammaires), la nouvelle scripta vernaculaire répond à des normes communautaires. Très variable, elle est empreinte de marques sociostylistiques de toutes sortes, comme le montre l’exemple en (1) tiré du corpus québécois Texto4Science (∼http://olst.ling.umontreal.ca/∼texto4sc/), qui fait l’objet de la présente étude.
On note ici l’absence de ponctuation (points ou virgules), une orthographe non standard (absence d’accent (mere, a, maniere), un accord non standard (de toutes manière), l’absence du ne de négation (ma mere arrive pas), un emprunt à l’anglais (so), deux québécismes lexicaux (pogner, char) et deux québécismes morphophonologiques (chu [ʃy] pour je suis, a [a:] pour à la).
L’avènement des médias sociaux et la multiplication des plateformes de discussion et d’échange (messages textes, Messenger, Discord) offrent l’occasion exceptionnelle de revoir la dichotomie traditionnelle entre français écrit normé et le français oral vernaculaire, et d’évaluer deux approches qui tentent d’expliquer la variation en françaisFootnote 2 : l’approche variationniste d’inspiration labovienne (Labov, Reference Labov1966, Reference Labov1972), qui dérive la variation de l’existence de variables inhérentes à toute grammaire, et l’approche diglossique. Dans son acception sociolinguistique initiale (Ferguson, Reference Ferguson1959), la diglossie renvoie a une séparation fonctionnelle des deux codes en fonction de la situation sociale de communication, alors que, dans le cadre de la grammaire générative, la notion de diglossie implique des grammaires distinctes : les francophones possèderaient deux grammaires: la grammaire du français standard et celle du français familier. Alors que l’approche variationniste se fonde sur la variation à l’oral, l’approche diglossique compare trop souvent le français standard (associé à l’écrit) et le vernaculaire (associé à l’oral). On peut alors se demander si la différence observée est attribuable à une différence de modalité (entre l’écrit et l’oral), plutôt qu’à une véritable distinction entre français standard et familier. Pour mieux saisir la différence, il faudrait garder la modalité constante, ce qui correspond à notre objectif.
D’une part, le français oral très normé correspond souvent à de l’oral préparé, élaboré à partir d’un discours écrit. D’autre part, jusqu’à tout récemment, l’écrit informel ne reflètait pas véritablement le vernaculaire, puisque généralement très influencé par l’écrit normé. L’avènement du discours numérique donne accès à de nouvelles sources de données pour explorer le vernaculaire. Ces nouvelles pratiques langagières sont non seulement un lieu privilégié d’observation du vernaculaire, mais offrent aussi une base empirique exceptionnelle pour évaluer les mérites respectifs des hypothèses diglossique et variationniste quant aux prédictions faites par les deux modèles.
À partir d’une comparaison entre l’écrit normé et l’écrit informel des textos, le présent article vient appuyer l’hypothèse de la diglossie : les deux types d’écrits font appel à des systèmes indépendants et obéissent à des règles distinctes. Notre discussion est organisée de la façon suivante. La section 2 commence avec une revue de la littérature sur l’hypothèse de la diglossie, et les débats théoriques et empiriques qu’elle soulève. La section 3 propose un bref aperçu de la recherche sur le discours numérique. La section 4 présente le corpus Texto4science d’où sont tirés la majorité des exemples du présent article. La section 5 traite plus spécifiquement de l’émergence d’une nouvelle forme d’écriture vernaculaire, une scripta vernaculaire, permise par les médias sociaux. Variable et perméable, elle est soumise à des normes communautaires. Finalement, la dernière section conclut l’article par une discussion des objectifs communicatifs de la langue des médias sociaux.
2. PROBLÉMATIQUE: VARIATION ET DIGLOSSIE EN FRANÇAIS
Plusieurs termes sont utilisés pour distinguer le français normé du vernaculaire, qu’ils soient considérés comme les deux pôles d’un continuum ou comme des grammaires distinctes. Ainsi, les étiquettes français standard, français normé, français de référence, français écrit, langue du dimanche (Blanche-Benveniste etal., Reference Blanche-Benveniste1990: 211), français classique tardif (Massot, Reference Massot2008) servent à désigner ce que les diglossistes appellent la variété haute, alors que français parlé, langue de tous les jours (Blanche-Benveniste, Reference Blanche-Benveniste1990), français ordinaire (Gadet, Reference Gadet1989), français démotique (Massot, Reference Massot2008), français dialectal (Zribi-Hertz, Reference Zribi-Hertz2013), français vernaculaire, français contemporain, français avancé font référence à la variété basse. Dans le présent article, l’expression français vernaculaire désigne la variété basse et français de référence (FR) la variété haute.
Afin de rendre compte de la variation en français, les tenants de l’approche diglossique (Massot, Reference Massot2008, Reference Massot2010; Barra-Jover, Reference Barra-Jover2010; Zribi-Hertz, Reference Zribi-Hertz2011, Reference Zribi-Hertz2013; Massot et Rowlett, Reference Massot and Rowlett2013; Rowlett, Reference Rowlett2013; Villeneuve et Auger, Reference Villeneuve and Auger2013) adoptent le modèle de Ferguson (Reference Ferguson1959) selon lequel deux variétés linguistiques ayant des fonctions et statuts distincts coexistent sur un territoire donné. La variété haute jouit d’un prestige social important. Utilisée en contexte formel (culte, littérature, universités, discours, etc.), elle est enseignée à l’école via l’écrit dans une forme très standardisée et peut s’appuyer sur de nombreux ouvrages didactiques (grammaires, dictionnaires). En contraste, la variété basse est utilisée en contexte familier (conversations familières, littérature populaire). Elle est transmise par voie orale et acquise naturellement comme langue première.
Selon cette approche diglossique, deux grammaires co-existent dans l’esprit des francophones. Le français familier correspondrait au vernaculaire : il serait innovant, stigmatisé socialement et acquis complètement en bas âge. Le locuteur en aurait la maîtrise stable du locuteur natif. La seconde grammaire correspondrait à la grammaire du FR. Prestigieux et conservateur, le FR serait transmis à l’école par le biais de l’écrit. Apprise tardivement et à des degrés variables, cette grammaire n’aurait pas la même stabilité cognitive chez le locuteur. Pour Zribi-Hertz (Reference Zribi-Hertz2013), la grammaire du français standard ne pourrait être intériorisée que si cette grammaire se conforme au Principe de cohérence,Footnote 3 qui exclut toute contradiction entre les grammaires.
Ce modèle ne fait cependant pas l’unanimité chez plusieurs sociolinguistes (dont Poplack, Reference Poplack1990; Poplack et Dion, Reference Poplack and Dion2009; Coveney, Reference Coveney2011; Gadet et Tyne, Reference Gadet and Tyne2012), qui considèrent la variabilité inhérente comme partie intégrante du système linguistique. Ainsi, il n’est pas nécessaire de poser deux grammaires étanches et distinctes pour rendre compte de la fluidité de la variation. Les tenants de l’approche variationniste proposent une grammaire unique mais variable: les points de variation seraient inscrits dans la grammaire et chaque locuteur choisirait les variantes inscrites à son répertoire en fonction du contexte sociolinguistique. Le français écrit normé et l’oral informel ne seraient que les deux pôles d’un continuum variationnel.
Alors que l’approche diglossique s’inscrit dans la lignée chomskyenne des travaux en linguistique formelle et se fonde sur les intuitions et les jugements de grammaticalité, l’approche sociolinguistique variationniste labovienne accorde un rôle central à la langue telle que produite par les locuteurs au sein des communautés. Selon cette dernière approche, les choix des locuteurs entre les différentes variantes sont systématiquement contraints par des facteurs linguistiques et sociaux qui reflètent non seulement le système grammatical sous-jacent, mais aussi l’organisation sociale de la communauté. Cette approche, quantitative, permet de documenter la variation et d’identifier les bases grammaticales et sociales du vernaculaire. Dans l’optique labovienne (Labov, Reference Labov1966, Reference Labov1994), la performance est « le reflet statistique de la compétence » (Cedergren et Sankoff, Reference Cedergren and Sankoff1974). Contrairement aux règles optionnelles du modèle traditionnel chomskyen, les règles variables permettent d’intégrer les dimensions internes (linguistiques) et externes (sociales) de la variation. La communauté linguistique n’est donc plus définie par un usage uniforme des variantes linguistiques, mais plutôt par la participation à un ensemble de normes partagées (Labov, Reference Labov1972: 120–121).
Comme on peut le constater, le débat sur la variation en français tient au nombre de grammaires nécessaires pour rendre compte de la variation. Une grammaire unique mais variable est-elle suffisante pour rendre compte de la variation, ou l’opposition entre FR et français vernaculaire est-elle si grande qu’il faille postuler l’existence de deux systèmes grammaticaux indépendants (ce qui n’exclut pas que les deux grammaires puissent partager certains traits)? Pour trancher le débat, il est nécessaire de comparer les prédictions différentes faites par les deux modèles et d’en vérifier la validité au moyen d’analyses détaillées.
Pour ce faire, nous proposons quatre critères: la différenciation formelle, la variabilité, la perméabilité et la représentation. Selon l’approche diglossique, les grammaires du FR et du français vernaculaire auraient des propriétés formelles distinctes. Cette approche permet qu’une même forme de surface puisse avoir des analyses structurales différentes selon les grammaires, comme le propose Rowlett (Reference Rowlett2013) pour les questions en est-ce que qui sont des clivées en Français Classique Tardif, mais implique un morphème compact esk en français démotique. Au contraire, l’approche variationniste stricte prédit l’absence de différences systémiques entre les deux pôles du continuum et ne permettrait pas d’analyser une même forme différemment à l’intérieur du continuum.
Le second critère est quantitatif. L’approche diglossique est compatible avec une différence de variabilité importante (quasi catégorique) entre les deux grammaires : une grammaire vernaculaire variable comportant un vaste répertoire de variantes et une grammaire normée peu variable au répertoire de variantes très restreint (Villeneuve et Auger, Reference Villeneuve and Auger2013). L’approche variationniste prédit plutôt une différence de variabilité graduelle le long du continuum.
Le troisième critère tient à la perméabilité. Selon nous, le modèle diglossique permet une asymétrie quant à la perméabilité des grammaires. Étant peu contrainte, la grammaire du français vernaculaire serait plus perméable à l’influence du FR (dans la mesure où cette influence respecterait le Principe de cohérence). On s’attendrait donc à retrouver de nombreux exemples de français vernaculaire intégrant des traits de FR, et ce à tous les niveaux de la grammaire. En revanche, la grammaire du FRFootnote 4 étant codifiée et par conséquent plus rigide serait beaucoup moins perméable et l’intégration de traits du vernaculaire serait rare et marquée,Footnote 5 possiblement limitée à certains aspects de la grammaire comme le lexique. L’approche variationniste ne prédirait pas une telle asymétrie, mais plutôt une gradation : une diminution (ou augmentation) des traits vernaculaires accompagnée d’une augmentation (ou diminution) des traits du FR le long du continuum, sans directionalité.
Finalement, un quatrième critère tient à la représentation des grammaires. Tous les participants au débat ont noté le problème posé par l’association du FR avec l’écrit et celle du français vernaculaire avec l’oral. Massot (Reference Massot2008: 51) offre une solution originale pour s’affranchir du biais de l’écrit associé au FR: puisqu’il considère que le français oral comme le français écrit sont des langues essentiellement vocales, il propose de leur donner une représentation graphique équivalente comme en (2), la forme en (2a) étant « marquée sociologiquement, comme non produite par les groupes populaires ».
Si cette approche permet effectivement une certaine neutralité représentationnelle (médiale), elle n’est pas sans problème, puisqu’elle ne permet plus de tenir compte des choix orthographiques des scripteurs. Or, certaines situations de communication permettent de mettre en évidence l’existence d’un système d’écriture parallèle en français, distinct du français écrit normé, comme illustré en (3).
L’approche diglossique fait la prédiction qu’un tel système associé à la grammaire vernaculaire pourrait émerger dans un contexte communicatif approprié. Les scripteurs, étant diglosses, auraient à leur disposition deux systèmes de communication : le système normé et le système vernaculaire, indépendamment de leur degré de scolarisation. Comme ces deux systèmes représenteraient des grammaires distinctes, on s’attendrait alors à ce qu’ils soient relativement indépendants. Dans une approche variationniste, la frontière entre les deux systèmes devrait être plus floue, selon le positionnement du scripteur sur le continuum.
3. MESSAGES TEXTES: UN APERÇU
Le discours numérique, souvent désigné comme la communication médiatisée par ordinateur, a non seulement connu un développement important (Crystal, Reference Crystal2011), mais a également bouleversé les pratiques de communication entre individus. Ces nouvelles pratiques interactionnelles ont suscité l’intérêt de linguistes dans le monde francophone dès l’avènement de la conversation par Minitel (Levy, Reference Lévy1993). Une dynamique de proximité y est souvent associée puisque le texto se construit dans l’interaction immédiate entre proches. À ce titre, les messages textes représentent une nouvelle variété de français écrit qui n’est pas ou peu éditée et qui se démarque par son informalité, son caractère émotif et sa nature éminemment sociale (Volckaert-Legrier etal., Reference Volckaert-Legrier, Goumi, Bert-Erboul and Bernicot2015).
En raison de sa nouveauté et des changements qu’il a entraînés, le discours numérique génère également un foisonnement de représentations en particulier au regard de la mise à l’écrit et du rapport qu’il entretient avec le FR (Tremblay, Reference Tremblay2020). L’observation des textos permet à ce titre de dégager les représentations du vernaculaire dans une forme écrite s’éloignant des diktats du FR. Cette section fournit un bref aperçu de la recherche sur le discours numérique tout en se focalisant sur les textos (mais en ne s’y limitant pas). Cet examen conduit à identifier les principales caractéristiques de ce genre de pratiques langagières et ce qui le distingue à la fois de l’écrit standard et de l’oral vernaculaire. Une attention particulière est portée à la variation sociolinguistique observable dans les textos en français québécois.
Les sciences du langage et de la communication se sont rapidement intéressées au discours numérique. Dans le monde francophone, plusieurs projets adoptant des perspectives différentes ont vu le jour et proposé des analyses détaillées. Citons entre autres, les travaux sur le clavardage (van Compernolle et Williams, Reference van Compernolle and Williams2007, Reference van Compernolle and Williams2010; van Campernolle, 2008, Reference van Compernolle2011; Williams, Reference Williams2009; Tatossian, Reference Tatossian2011, Reference Tatossian2020) ou encore le projet SMS pour la science, qui visait la constitution d’un vaste corpus de textos (Fairon etal., Reference Fairon, Klein and Paumier2006) et qui s’est décliné dans plusieurs zones de la francophonie (Belgique, Canada, France, Réunion, Suisse). Crystal (Reference Crystal2011) identifie l’hybridité comme une caractéristique de la langue de l’internet. Il explique que l’appel conjoint aux propriétés de l’oral et de l’écrit donne naissance à un nouveau médium de communication.
En raison du besoin d’être compris, la langue des textos conserverait plusieurs traits du FR, bien que l’orthographe particulière associée à ces pratiques attire l’attention. À ce titre, plusieurs études ont examiné les conventions orthographiques du discours numérique qui se distinguent du FR et qui renvoient à la créativité scripturale ou à ce que certains appellent la néographie (Cougnon et Beaufort, Reference Cougnon and Beaufort2009; Roche etal., Reference Roche, Verine, Lopez and Panckhurst2016). Plusieurs ont noté que les messages textes sont marqués par une transcription phonético-graphique, une phonétisation et le recours à l’abbréviation (Fairon etal., Reference Fairon, Klein and Paumier2006; Bertrand, Reference Bertrand2011; Bertrand et Drouin, Reference Bertrand and Drouin2011; Blondeau, Tremblay et Drouin, Reference Blondeau, Tremblay and Drouin2014). Des résultats similaires sont attestés dans des études s’intéressant à des corpus de clavardage francophones (van Compernolle et Williams, Reference van Compernolle and Williams2007, Reference van Compernolle and Williams2010; van Compernolle, Reference van Compernolle2011) ou encore à une combinaison de corpus francophone, hispanophone et anglophone (Tatossian, Reference Tatossian2011, Reference Tatossian2020). Les clavardeurs recourent à des stratégies visant à reproduire les paramètres d’une conversation en face à face, ce qui correspond « à une mise à l’écrit de formes habituellement réservées au code oral et à l’informalité » (Tatossian, Reference Tatossian2020: 121).
Pour mieux comprendre le discours numérique et ses rapports à l’oralité, certaines recherches plus récentes s’y sont intéressées sous l’angle de la variation, une approche qui permet justement de mieux cerner le rapport au vernaculaire. Dans le domaine de la morphosyntaxe, on a examiné la variation dans l’usage de la négation verbale dans les textos (Stark, Reference Stark2012) et dans le clavardage (van Campernolle, Reference van Compernolle2008; Williams, Reference Williams2009) qui se caractérisait par une forte absence de ne, quoique moins marquée qu’à l’oral. Par ailleurs, l’étude de la variation de la marque d’accord sujet verbe (Stark, Reference Stark2011) dans des textos suisses francophones montrait que malgré plusieurs accords non standard, l’accord canonique s’avérait le plus fréquent tant avec les sujets lexicaux que pronominaux. En ce qui a trait aux interrogatives, Guryev (Reference Guryev2018) a démontré que les tendances dans l’oral ordinaire et dans les textos suisses n’étaient pas en tous points identiques car même si les deux modes d’interactions appartenaient au français informel, le poids particulier des contraintes interactionnelles était différent. Les quelques travaux variationnistes sur le français québécois ont principalement porté sur la morphosyntaxe et la morphophonologie: l'alternance entre les pronoms forts nous/nous autres (en tant que non clitiques) (Blondeau etal., Reference Blondeau, Tremblay and Drouin2014), et entre les clitiques sujets on/nous (Blondeau etal., Reference Blondeau, Tremblay and Drouin2014), la référence temporelle au futur (Tremblay etal., Reference Tremblay, Blondeau and Labeau2019) et l’usage des pronoms impersonnels (Tremblay, Reference Tremblay2020), phénomènes sur lesquels nous reviendrons plus loin.
Enfin, un autre débat a lieu en ce qui a trait à l’évolution des textos. Si certains y voient une variété non codifiée en évolution constante (Crystal, Reference Crystal2008), d’autres y voient un code qui correspond à des normes communautaires (Fairon etal., Reference Fairon, Klein and Paumier2006) typiques de l’oral. L’analyse qui suit contribue à ce débat. Ce type d’échanges, où règne une très grande intimité entre les interlocuteurs, est beaucoup plus souvent associé au contexte familier de l’oral qu’au contexte plus formel de l’écrit standard. En ce sens, les messages textes répondent aux critères de l’immédiat communicatif puisqu’ils partagent la plupart des valeurs paramétriques du français parléFootnote 6.
4. MÉTHODOLOGIE
4.1. Choix du corpus texto
Les corpus de messages textes se prêtent particulièrement bien à l’évaluation de l’hypothèse de la diglossie. Tout d’abord, ils présentent l’avantage évident de garder la modalité constante lors de la comparaison avec le français écrit normé. Ensuite, comme les messages textes sont des échanges informels entre proches, ils représentent bien le vernaculaire local. Alors que le FR comporte très peu de différences dans la francophonie,Footnote 7 les messages textes sont très marqués au niveau local. On peut ainsi contraster le message texte québécois en (1) avec les messages textes belges en (4), qui se distinguent par de très nombreux traits de vocabulaire (fart, glanD, wc), de graphie (2m1, b1), de phonologie (comme [ɛ] pour [e] dans Jesaierè, ou [œ̃] pour [ɛ̃] dans 2m1, b1, etc.).
Alors que le débat sur la diglossie a surtout porté sur le français hexagonal, on peut se demander ce que l’étude de textos en français laurentien peut apporter au débat. Notons d’emblée que le français laurentien est une variété de français et non une langue gallo-romane indépendante comme le picard ou le gallo. Issu de la tradition populaire (Poirier, Reference Poirier2009), le français d’Amérique s’est établi avant la codification de la langue au 17ème siècle, à l’abri de l’influence normative européenne. Pour cette raison, la distance entre variété haute, issue de la tradition codifiée, et variété basse, issue de la tradition populaire, est encore plus grande dans ce dialecte, même dans le cas du français québécois soutenu qui conserve de nombreux traits vernaculaires (Bigot, Reference Bigot2021; Villeneuve, Reference Villeneuve2017).
4.2. Corpus
Les données sur lesquelles repose cette analyse émanent du projet Texto4Science (Langlais et Drouin, Reference Langlais and Drouin2012), représentant le volet québécois francophone du projet SMS4science (http://www.sms4science.org). Les données ont été recueillies en 2009–2010 dans le cadre de la campagne Faites don de vos textos à la science. Au total, 7,274 messages envoyés par 360 différents texteurs (ou plus exactement de 360 numéros de téléphone) ont été recueillis et la vaste majorité de ces textos étaient rédigés en français seulement (6,842 messages). Le fait que les données aient été recueillies il y a une dizaine d’années, avant la très grande popularisation des correcteurs orthographiques, constitue un avantage, puisque le texteur gardait davantage le contrôle de ses choix orthographiques.
Comme le corpus a été recueilli à partir d’une campagne de sollicitation de dons,Footnote 8 il ne prétend pas à la représentativité de la communauté des texteurs. Cependant, les informations sociolinguistiques recueillies auprès de 298 répondants par le biais d’un formulaire contenant 23 questions ont permis de dégager les caractéristiques sociales des texteurs, comme l’âge, le genre et la scolarité. L’âge moyen des participants était de 27 ans et près de 72% des répondants avaient entre 12 et 39 ans, 63 % étaient des femmes et, fait important, 60% des répondants déclaraient avoir reçu une éducation universitaire.
4.3. Recherche et extraction des données
Aux fins de la présente étude, les données ont été extraites et sélectionnées à partir de recherches par suites de caractères dans un fichier .txt comprenant la totalité du corpus en français. Nous avons procédé en trois temps : 1- sélection préalable de variables ayant fait l’objet d’études sociolinguistiques en français québécois oral, 2- identification des variantes et de leur différentes transpositions dans les messages textes, et 3- recherche par suite de caractères dans le corpus Texto4Science. Contrairement à nos études antérieures (Blondeau etal., Reference Blondeau, Tremblay and Drouin2014; Tremblay etal., Reference Tremblay, Blondeau and Labeau2019; Tremblay, Reference Tremblay2020), notre objectif n’était pas de faire une analyse quantitative d’une ou deux variables, mais plutôt de brosser un portrait général au moyen d’une approche qualitative. En ce sens, le présent article se situe plutôt dans la lignée de travaux descriptifs, comme celui de Fairon etal. (Reference Fairon, Klein and Paumier2006), qui propose une typologie des différents procédés utilisés (phonétisation des caractères, phénomènes graphiques et lexicaux, icônes et symboles divers, morphosyntaxe, syntaxe, discours, variété de formes). Dans notre cas, la typologie est inspirée des travaux en linguistique variationniste, en particulier des variables préalablement identifiées dans ces travaux.
5. LES TEXTOS COMME LIEU D’EXPRESSION DU VERNACULAIRE
S’appuyant sur une analyse de textos tirés du corpus Texto4Science, la section qui suit fait ressortir comment les nouvelles technologies permettent la constitution de nouveaux espaces virtuels qui agissent comme lieux privilégiés d’expression du vernaculaire. Pour ce faire, nous revenons sur les quatre critères présentés à la section 2 : différentiation formelle, variabilité, perméabilité et représentation. Ainsi, nous montrons (5.1) comment les textos reposent, comme l’oral familier, sur une grammaire qui se distingue de façon systématique du FR. À l’instar de McCulloch (Reference McCulloch2019), nous visons à mieux comprendre les nouvelles règles de cette pratique langagière (« understanding the new rules of language »), mais montrons aussi comment les textos reflètent intrinsèquement une grammaire variable (5.2) et perméable (5.3). Enfin, une dernière section (5.4) examine la néographie comme moyen de représentation des variantes vernaculaires.
5.1. Une grammaire vernaculaire distincte
Plusieurs éléments à différents niveaux de la structure linguistique montrent comment les textos reflètent une grammaire vernaculaire formellement distincte du FR. Sans prétendre à l’exhaustivité, nous illustrons ce constat à partir d’exemples tirés du corpus aux niveaux du lexique, de la morphophonologie, de la morphosyntaxe, de la morphologie et de la syntaxe.
Le relevé indique un vaste répertoire d’items lexicaux qui correspondent à des pratiques typiques du français local. Si on reprend l’exemple (1) présenté en introduction, on note la présence de char « voiture » et le verbe pogner « prendre », des formes lexicales attestées des variétés de français parlé en Amérique du Nord. Dans les exemples en (5), on relève le sacre estie (juron d’origine religieuse formé à partir de hostie), de même que de nombreux emprunts à l’anglais : les noms dude et bitch, deux emprunts employés comme termes d’adresse, l’adjectif chill et l’adverbe full, des emprunts récents à l’anglais, et même que le verbe scorer, un emprunt bien établi et intégré sur le plan morphologique. Le recours aux emprunts, de même que l’alternance de codeFootnote 9, phénomènes illustrés en (5b), ne font pas partie des phénomènes observés dans le corpus de SMS belge (Fairon etal., Reference Fairon, Klein and Paumier2006). Or, en contexte nord-américain, les emprunts à l’anglais sont fréquents et touchent plusieurs catégories lexicales (Poplack Reference Poplack2017).
En ce qui a trait à la morphophonologie, alors que le FR permet la fusion de la préposition et du déterminant uniquement avec les prépositions de et à, suivies des déterminants le et les, le français québécois étend ce phénomène à d’autres prépositions comme dans et sur, suivies des déterminants la et les. Le relevé des textos indique des cas de fusion entre une préposition et un déterminant qui s’éloignent du standard. L’exemple (5a) ci-dessus montrait l’usage de dans zone [dã:zon] « dans la zone », représentant la fusion de la préposition dans et du déterminant féminin singulier la. On retrouve en (6) également la réalisation din [d̃:] qui représente la fusion de dans avec le déterminant pluriel les.
Dans le dernier exemple, on note également l’emploi de shu, une représentation de la réduction du pronom je + suis. Par ailleurs, l’exemple 7 illustre l’emploi de a pour elle qui reflète l’élision du [l] et le changement de la voyelle en [a].
En ce qui concerne la morphologie et la morphosyntaxe, signalons la neutralisation du genre du pronom pluriel. En (8), la forme y [i] représente le pronoms ils [il] pluriel dont l’antécédent est le syntagme nominal les filles. Cet exemple illustre également le redoublement du sujet (les filles y), un phénomène fréquemment mentionné dans les travaux sur le français familier.
Le relevé indique aussi des éléments intéressants au niveau morphologique comme le morphème d’approximation -ish « environ », un emprunt morphologique récent illustré en (9).
Enfin, au niveau syntaxique, le relevé montre l’effacement du que, qui serait requis en FR, de même que des interrogatives impliquant la particule interrogative -tu, deux phénomènes illustrés en (10).
Cette section avait pour but d’établir à partir d’exemples de textos les particularités formelles de la grammaire vernaculaire et de démontrer comment elle se distingue du FR. La prochaine section se penche sur la variabilité de la grammaire vernaculaire et l’étendue du répertoire des variantes.
5.2. La variabilité
5.2.1. Études variationnistes quantitatives
Quelques analyses variationnistes quantitatives ont montré que l’usage dans les textos suivait les principales tendances observées à l’oral malgré certaines différences sur le plan des contraintes sociales ou linguistiques (Blondeau etal., 2014, Tremblay etal., Reference Tremblay, Blondeau and Labeau2019, Tremblay, Reference Tremblay2020).
En ce qui concerne la morphologie verbale, une analyse de la référence temporelle au futur dans les textos québécois menée dans le cadre d’une comparaison avec le français de Belgique (Tremblay etal., Reference Tremblay, Blondeau and Labeau2019) a montré qu’il y avait des points communs entre les deux variétés quant au répertoire des variantes et au recours à la forme du présent du futur (arrive dans l’exemple 1). Le recours au présent du futur, observé dans les deux variétés, y était nettement plus fréquent (près de 50%) que dans les entretiens sociolinguistiques (moins de 10% selon Poplack et Turpin, Reference Poplack and Turpin1999), tout en étant conditionné par les mêmes facteurs linguistiques qu’à l’oral. L’usage plus important du présent du futur dans les textos peut s’expliquer par le contexte. La proximité et le savoir partagé des interactants ou le contexte communicatif rendent superflu l’ajout d’une marque morphologique du futur. Pour ce qui est des deux autres variantes, nommément les variantes synthétique et analytique, on a noté une différence significative dans les préférences, le futur synthétique étant plus fréquent dans les textos belges (72%) que dans les textos québécois (37%) (Tremblay etal., Reference Tremblay2020). Le faible usage du futur synthétique dans les textos québécois correspond aux tendances générales observées à l’oral, quoique l’association avec la polarité négative n’y soit pas aussi forte. On aurait peut-être ici une influence de l’écrit standard puisque l’utilisation du futur synthétique en contexte affirmatif est très rare dans le français oral local.
Trois analyses variationnistes sur l’usage des pronoms dans les textos ont abordé différents aspects de la variation observable dans la grammaire vernaculaire. Tout d’abord, en ce qui concerne la variation entre les pronoms de première personne du pluriel, on a constaté la prévalence de on et la rareté de nous (Blondeau etal., Reference Blondeau, Tremblay and Drouin2014). Toutefois les fréquences étaient différentes de l’oral, puisqu’il y avait davantage de nous dans les textos (4% selon cette étude) qu’en français oral (1% selon Laberge, Reference Laberge1977). Dans certains textos, l’usage de nous était clarement associé à un contexte stylistique plus soutenu entraînant un recours à la forme associée au FR écrit alors que dans d’autres cas comme en (11), nous avons une présence de nous dans un contexte relativement informel où on commente une partie de hockey. Cet exemple illustre bien que même si les textos se rapprochent de l’oral spontané, ils n’en sont pas un reflet exact puisqu’on y voit davantage de recours à des marques plus formelles associées au FR, parfois dans des contextes inattendus.
Un autre cas intéressant pour notre propos est celui de l’alternance entre les pronoms forts simples (nous, vous, eux, elles) et les formes complexes avec autres longtemps associées au français local (Blondeau, Reference Blondeau2011). Or, une seule forme en autres, exemplifiée en (12), était présente dans le corpus analysé, alors que le recours à la forme simple était quasi-catégorique. Bien que cette préférence corresponde à l’avancée du changement en faveur des formes simples observée dans le français parlé (48% de formes simples en 2012 dans Blondeau etal., Reference Blondeau, Tremblay and Bourely2022), la faible représentation des formes en autres force à constater que les messages textes ne sont pas un reflet en tout point identique à l’oral et se caractérise par l’hybridité (Blondeau etal., Reference Blondeau, Tremblay and Drouin2014).
Enfin, l’analyse quantitative de la variation dans l’usage des pronoms impersonnels dans les textos (Tremblay, Reference Tremblay2020) indique que l’absence du pronom impersonnel (il ou i) dépasse ce qui est observé à l’oral (87% d’omission dans le corpus texto4science vs 68% rapporté dans Djuikui Dountsop, Reference Djuikui Dountsop2018 pour le corpus Montréal, 1984). Les exemples présentés en (13) révèlent ici des pratiques orthographiques s’inspirant davantage de l’oral et visant à suppléer l’écrit standard qui apparaît inadéquat ou insuffisant dans le contexte de proximité associé au texto.
5.2.2. Un répertoire de variantes étendu
Nos observations de nature qualitative relèvent également d’autres variables sociolinguistiques qui ont généré de l’intérêt dans des études antérieures sur la variation dans le français parlé. À l’examen, on remarque très souvent les mêmes variantes qu’à l’oral et, par conséquent, une étendue beaucoup plus large du répertoire de variantes qu’en FR.
C’est le cas de la négation du verbe, une variable largement étudiée dans l’ensemble de la francophonie. Ce que révélait les études des textos ou des clavardages était que l’omission de ne y était largement répandue. Cependant, l’examen d’un corpus de textos suisses francophone (Stark, Reference Stark2012) montrait que le taux d’omission s’élèvait à 23%, ce qui était moins élevé qu’à l’oral, bien que des contraintes linguistiques similaires s’observaient comme la nature du sujet, l’omission de ne étant plus fréquente avec les pronoms. Dans le corpus, nous relevons largement l’absence du ne de négation, mais nous avons des cas qui attestent de l’absence et de la présence de ne dans un même énoncé. Les deux exemples qui suivent montrent deux cas de variation inhérente chez un même texteur et, en fait, ce qui frappe dans ces exemples, c’est beaucoup plus la présence de ne que son absence.
Par ailleurs, la variation lexicale est largement présente, comme l’indique l’alternance observée entre les variantes lexicales boulot, emploi, job et travail, pour exprimer le champ sémantique «travail» illustrée en (16). Notons ici, qu’il n’y a aucune occurrence du terme ouvrage, pourtant attesté dans des études antérieures sur l’oral, alors que l’usage du terme boulot, qui semble ici une forme relativement nouvelle en français québécois, était absente du contexte variable dans les années antérieures (Sankoff, Reference Sankoff1997). Le répertoire des variantes de ce champ sémantique aurait donc évolué au fil du temps.
Enfin, en ce qui a trait à la syntaxe, Guryev (Reference Guryev2018), dans son étude sur les textos suisses, considérait que les tendances étaient différentes de celles observées dans l’oral ordinaire. Il expliquait cette différence par le poids des contraintes interactionnellesFootnote 10 dans la réalisation des interrogatives, ce qui rappelle les résultats sur l’utilisation du présent pour exprimer la référence temporelle au futur (Tremblay etal., Reference Tremblay2020). Le relevé dans le corpus québécois montre qu’on a un répertoire similaire à celui de l’oral avec la forme intonative en (17a), la variante est-ce que (17b), l’inversion avec le pronom de deuxième personne (18a) et le tu interrogatif qui est absent du FR (18b), ces deux dernières variantes étant bien attestées dans notre relevé. Les exemples en (17) et (18) illustrent également la variation chez un même texteur.
Dans le domaine de la variation pragmatico-discursive, le relevé des variantes montre un large éventail dans l’emploi des marqueurs de conséquence. On y retrouve en effet, le marqueur de prédilection à l’oral (ça) fait-que en (19a), sur lequel nous reviendrons dans la section sur la représentation du vernaculaire, de même que la variante so, un emprunt à l’anglais illustré en (1) et en (19b). Cette présence de so, dont l’emploi est principalement attesté à l’oral dans des communautés minoritaires bilingues comme en Ontario et en Acadie, tranche avec ce qui a été observé dans les études antérieures sur le français montréalais (Blondeau etal., Reference Blondeau, Mougeon and Tremblay2019).
On observe également les deux autres variantes alors et donc illustrées en (20). Bien qu’elles se rattachent au FR, mais pas exclusivement, ces formes sont employées couramment dans les textos, mais souvent dans des messages qui se caractérisent par une langue plus neutre.
Les observations qualitatives et quantitatives présentées dans les sections 5.1 et 5.2 ci-dessus ont fait ressortir la très grande variabilité de la grammaire vernaculaire, variabilité que reflète sa mise à l’écrit dans les messages textes. La prochaine section se penche sur la perméabilité des grammaires.
5.3. La perméabilité
Selon Massot (Reference Massot2008: 257–258), « la diglossie fait une prédiction forte: les productions des locuteurs diglosses doivent être cohérentes, c’est-à-dire qu’elles doivent être produites entièrement par une des deux grammaires […]. » Massot suggère la proposition comme domaine maximal à l’intérieur duquel la cohérence grammaticale doit être respectée. Comme nous l’avons discuté à la section 2, le modèle diglossique n’exclut pas une certaine perméabilité des grammaires, mais prédit une assymétrie quant à cette perméabilité. Étant hautement codifiée, la grammaire du FR est très rigide, ce qui limite l’intégration de traits vernaculaires. C’est d’ailleurs cette propriété qui explique l’absence de variation dialectale en FR. En revanche, le français vernaculaire est peu contraint et on s’attend à retrouver de nombreux exemples de français vernaculaire intégrant des traits de FR, et ce, à tous les niveaux de la grammaire.
Le corpus Texto4Science comporte quelques rares exemples écrits en français hyper-normé, relevant le plus souvent du domaine du droit, du travail ou de l’éducation, comme (21) ci-dessous. Typiquement, ce type de message, où dialectalismes et traits non standard sont absents, ne comporte aucune transgression orthographique.
Le corpus comporte aussi de nombreux exemples vernaculaires. Lorsque ces messages textes sont écrits en orthographe standard, il n’est pas rare qu’on y retrouve des marques de français hyper-normé, comme l’utilisation du pronom nous en (11). On observe donc une certaine variation. Ainsi, alors que l’exemple (22a) combine trois jurons (populaires) et la particule négative ne (très rare en français oral), l’exemple (22b) ne comporte pas la particule négative.
Cette absence de la particule ne dans l’exemple (22b) vient appuyer l’hypothèse de la cohérence grammaticale de Massot. En revanche, un exemple comme (22a), loin d’être un cas unique, vient la contredire, puisqu’on y retrouve les jurons Tabarnak et Criss (populaires) et la particule ne (hyper-formelle) à l’intérieur d’une même proposition. Peu contrainte, la grammaire du français vernaculaire apparaît donc très perméable à l’influence du FR. L’approche variationniste ne prédirait pas une telle asymétrie entre les grammaires du FR et du français vernaculaire, mais plutôt une gradation le long d’un continuum, sans directionalité. En revanche, le modèle diglossique permet une certaine asymétrie quant à la perméabilité des grammaires. Étant peu contrainte, la grammaire du français vernaculaire est plus perméable à l’influence du FR.
Cette perméabilité n’est cependant pas sans limite. Les messages textes vernaculaires écrits avec une orthographe innovante ne permettent pas l’intégration de marques hyperformelles. Dans ce type de message, on ne retrouve jamais la particule négative ne.
La section qui suit traite de l’importance de ce choix délibéré de représentation du vernaculaire.
5.4. La néographie comme système de représentation du vernaculaire
Si plusieurs études ont examiné la néographie associée aux textos, on a peu discuté des représentations des traits caractéristiques du vernaculaire. Plusieurs exemples discutés précédemment suggèrent l’émergence d’une scripta vernaculaire. Ainsi, comme discuté en 4.1, la fusion de la préposition dans et du déterminant défini, représentée au singulier par dan (dan zone) et au pluriel par din (din dernières), illustre bien comment la néographie implique une mise en texte délibérée d’un phénomène de variation morphophonologique. Rappelons ici que les messages textes analysés proviennent de texteurs scolarisés (60% d’entre eux déclarent avoir reçu une éducation universitaire). Donc, il semble que les texteurs, par leur choix typographique, se représentent clairement certaines variantes non standard, ce qui reflèterait la saillance de certains traits et un effort délibéré de les mettre en évidence dans leurs messages textes.
Bien sûr, ces néographies ne sont pas nécessairement fixes ou stablesFootnote 11 puisque qu’on les voit représentées sous une panoplie de formes. Notre relevé indique un tel phénomène en ce qui a trait à la réduction de la préposition avec pour laquelle la consonne /v/ est souvent effacée à l’oral, ce qui permet plusieurs prononciations. Les texteurs recourent à différentes représentations néographiques de cette réduction phonologique, illustrées en (24). Les exemples en (25) illustrent ces réalisations dans le corpus.
Pour revenir à la variation pragmatico-discursive discutée dans la section sur la variabilité, nous avons noté différentes réalisations néographiques du marqueur de conséquence (ça) fait que. Non seulement la forme est réduite phonologiquement par l’absence de ça, mais on observe également, comme à l’oral, une distinction selon la qualité de la voyelle. Si certains texteurs emploient la forme faque, ci-dessus en (19) ou fak (26) (ou des réalisations similaires), d’autres lui préfèrent fek, illustré en (27a) ou faik (27b). Les formes néographiques employées ici renvoient à une distinction sociolinguistique qui marque les usages communautaires à l’oral, c’est-à-dire la distinction entre [fak] et [fɛk].Footnote 12 En effet, une valeur sociolinguistique distincte semble associée à l’ancienne forme [fak] qui est remplacée par la nouvelle forme [fɛk], un changement mené par les femmes des classes intermédiaires (Blondeau et Tremblay, Reference Blondeau and Tremblay2022). Ainsi, les usages néographiques reflèteraient une représentation claire des pratiques vernaculaires communautaires.
Enfin, on observe un autre cas intéressant, celui de la représentation néographique en chu, shu et chui pour représenter je suis, illustré en (1), (6b) et (28). On a ici trois néographies de la réalisation phonétique qui consiste en un phénomène combiné d’assimilation consonantique (assourdissant la chuintante [ʒ]) et de réduction vocalique. Si la graphie «ch» comme en (1) et (28) est attendue, le recours au «sh» en (6b) est plus surprenant, car il transgresse la représentation orthographique française traditionnelle. Nous retrouvons un phénomène de même type avec certaines réalisations de chez nous (29).
Ces quelques observations indiquent que malgré une certaine instabilité propre à une pratique langagière émergente, on retrouve dans la néographie une claire représentation du vernaculaire et une mise en texte de certaines variantes du système qui sont généralement gommées par l’orthographie du FR. L’analyse a montré comment les usagers font preuve de créativité et, par leur mise en texte, performent leur vernaculaire.
5.5. Résumé
La section 5 a présenté les textos comme un lieu d’expression du vernaculaire. D’une part, les messages textes convoquent toutes les ressources linguistiques (phonologiques, lexicales, morphologiques, syntaxiques, sémantiques et discursives) de la grammaire vernaculaire. Cette grammaire est régie par des normes communautaires, essentiellement locales, et non par des normes externes comme le FR. Ce recours à la grammaire du vernaculaire se manifeste par une grande variabilité et par le vaste répertoire des variantes non standard utilisées dans les messages textes. Nous avons aussi identifié une autre source de variabilité des messages textes : la perméabilité de la grammaire vernaculaire, qui permet d’y introduire des traits du FR. C’est cette perméablité qui crée l’illusion que les messages textes sont des formes hybrides, à l’intersection de l’oral et de l’écrit. Finalement, nous avons vu que ce mode d’expression du vernaculaire se développe partiellement en autarcie du code écrit standard ce qui est reflété par la néographie adoptée.
6. CONCLUSION
En linguistique, le débat sur la diglossie fait souvent intervenir des observations de nature qualitative qui reposent pourtant sur deux modalités différentes : le français de référence (écrit) et le français vernaculaire (oral). L’étude de corpus de messages textes permet de repositionner le débat en contrôlant la modalité et en faisant intervenir la question de la variabilité et de la perméabilité.
Les premières études sur les messages textes et autres formes de discours numérique ont surtout soulevé les transgressions par rapport à la norme (orthographe, vocabulaire, syntaxe). Par la suite, la mise sur pied de corpus a permis de quantifier cet écart par rapport à l’écrit normé à partir d’études quantitatives sur des variables spécifiques. Ces mêmes études ont mis en évidence les similarités importantes entre l’écrit vernaculaire et les corpus oraux. Dans les deux cas, on cherchait toujours à mesurer l’écart entre les nouvelles pratiques et soit l’écrit normé, soit l’oral vernaculaire. Or, pour les linguistes, ces nouvelles pratiques langagières offrent un terrain d’investigation exceptionnel, qui doit être envisagé de façon autonome, dans une perspective holistique.
Plutôt que de tenter de mesurer le degré d’oralité des messages textes, la présente étude visait à explorer comment les messages textes constituent un lieu d’expression du vernaculaire dans sa forme écrite. Notre analyse a montré que la grammaire du vernaculaire, telle qu’elle peut se manifester dans les messages textes, se démarque du FR par sa variabilité et sa perméabilité. En plus, les observations sur la mise à l’écrit, ou plutôt la mise au texto, indiquent que les usagers se représentent très bien les variantes vernaculaires, si bien qu’ils se dégagent du poids du FR, et leur donnent une représentation néographique. Nous en concluons que les messages textes reflètent les propriétés d’une grammaire vernaculaire distincte de celle de la grammaire du français de référence.
Le français de référence, dont l’expression privilégiée se retrouve à l’écrit et qui fait l’objet d’un long apprentissage à l’école, est très rigide et uniforme dans la francophonie. On peut s’interroger sur ce qui pousse les texteurs à transgresser une norme qu’ils ont appris à maîtriser. Pourquoi innover en créant une nouvelle forme de communication écrite alignée sur la langue familière? En raison de sa formalité et de sa rigidité, le français écrit standard ne permet pas de communiquer aussi efficacement que la nouvelle scripta vernaculaire quantité d’informations contextuelles partagées qu’on retrouve habituellement dans une conversation entre proches. Le français standard, surtout à l’écrit, ne permet pas de jouer de la même façon et avec la même liberté sur le terrain de l’expression identitaire, alors que la scripta émergente des textos permet d’écrire son vernaculaire, ce que Caron et Caronia notaient déjà en 2005 : « Dans la culture des adolescents européens et nord-américains, envoyer des SMS n’est pas juste un moyen efficace pour faire circuler de l’information de façon rapide et pratique. Il s’agit plutôt d’une performance verbale grâce à laquelle ils construisent et maintiennent leurs liens sociaux » (cité dans Fairon etal., Reference Fairon, Klein and Paumier2006 : 5). Notre analyse vient appuyer Caron et Caronia et s’inscrit dans la troisième vague en sociolinguistique, qui montre que la langue ne reflète pas uniquement des catégories sociolinguistiques traditionnelles, mais que la variabilité permet au locuteur d’encoder son style personnel (sa persona), d’exprimer son identité et ses appartenances à des réseaux et des communautés de pratique et de moduler ses pratiques en fonction de l’interlocuteur.
En conclusion, le discours numérique occupe une place de plus en plus importante dans la vie sociale et les dernières années ont vu croître son rôle dans l’établissement et le maintien de liens sociaux. Autrefois réservées aux jeunes et aux initiés, les nouvelles plateformes ont diversifié leur membership, de telle sorte qu’il n’est plus rare de voir des octogénaires ou même des nonagénaires afficher du contenu sur Facebook ou communiquer avec leurs proches via Messenger. En 2022, avec la multiplication et la diversification des contextes d’échanges numériques, il est fort probable que l’on assiste à un déplacement des pratiques scripturales informelles vers d’autres plateformes tout aussi propices à l’expression vernaculaire comme Discord, utilisé par de nombreux jeunes pour jouer en ligne, ou encore Messenger ou Snapchat. En contexte québécois, on s’attend à ce que ces nouvelles plateformes reflètent non seulement le vernaculaire traditionnel tel que documenté dans le présent article, mais de plus en plus les nouveaux multiethnolectes typiques de certaines communautés de pratique dans certains quartiers multiculturels montréalais (Blondeau & Tremblay, Reference Blondeau and Tremblay2016). Ces nouveaux espaces communicatifs émergent comme autant de lieux d’expression d’appartenance à des réseaux denses et restreints et, en raison de ses capacités expressives, la nouvelle scripta vernaculaire s’avère nettement mieux adaptée que le FR pour répondre aux besoins communicatifs des texteurs. La prise en compte des procédés néographiques examinés dans cet article apportera, nous l’espérons, une contribution aux études sur la sociolinguistique de l’écrit en français.
[10 043 mots]
Competing interests
The authors declare none.