‘A fox who had never yet seen a lion, when he fell in with him for the first time in the forest was so frightened that he was near dying with fear. On his meeting with him for the second time, he was still much alarmed, but not to the same extent as at first. On seeing him the third time, he so increased in boldness that he went up to him and commenced a familiar conversation with him.’ (Ésope, cité par Thompson Reference Thompson2009)
1. INTRODUCTION
Le locuteur francophone dispose d’un important arsenal de structures afin de formuler des questions, tout particulièrement dans le cas de l’interrogation partielle (Coveney, Reference Coveney2020 : 3) (Tabl. 1).
Si la majorité des variantes applique le schéma Q antéposé ou ex situ, le français compte également une structure in situ : Tu vas où ? (SVQ), dans laquelle le mot Q occupe « la place où serait le complément dont il joue le rôle » (Le Goffic, Reference Le Goffic1993 : 110). Le système des interrogatives étant historiquement celui de Q ex situ (Kunstmann Reference Kunstmann1990), il est intéressant de savoir si la variante SVQ possède un fonctionnement propre qui le différencierait des autres variantes. Pour répondre à cette question, nous adopterons dans cette étude une hypothèse d’ordre fonctionnaliste selon laquelle le choix entre plusieurs variantes sert aux interactants de ressource d’ordre pragmatique qui « permet de rechercher et d’atteindre une certaine optimisation des procédures d’encodage » (Berrendonner, Reference Berrendonner, Schoeni, Bronckart and Perrenoud1988 : 50). La variabilité importante dans la forme des interrogatives dont fait preuve le français sera alors considérée comme la condition sine qua non d’une certaine souplesse inhérente à toute interaction linguistique entre individus. Celle-ci est intrinsèquement adaptable aux besoins des interactants en fonction des contraintes, linguistiques ou externes, qui la constituent.
Dans ce travail, qui s’inspire de l’étude de Coveney (Reference Coveney1995; cf. Hamlaoui Reference Hamlaoui, Clarkson, Absi, Ogawa, Ono, Patterson and Villafana2010; Li, Reference Li2021 : 48), nous explorerons cette propriété centrale de l’interaction (i.e. le fait d’être adaptable aux besoins des interactants) sous l’angle des contraintes qu’impose le concept de structure informationnelle sur la sélection des variantes. Plus précisément, il s’agira d’examiner de possibles liens entre l’emploi de SVQ et la structure de l’information : nous mettrons notamment à l’épreuve deux hypothèses formulées par Coveney (Reference Coveney1995) selon lesquelles la sélection de SVQ ferait l’objet des principes dits ‘End-Weight’ et ‘End-Focus’, les deux étant considérés comme faisant partie de quatre principes généraux qui ordonnent la structuration informationnelle des énoncés (Hilpert, Reference Hilpert, Aarts, MacMahon and Hinrichs2021 : 231). Notre étude s’appuiera sur un examen de 425 exemples de l’interrogation partielle, dont 225 occurrences de SVQ (52,9%) en provenance du Corpus suisse de SMS (Stark, Ueberwasser et Ruef Reference Stark, Ueberwasser and Ruef2009–2015).
Cette étude s’articulera en plusieurs étapes. Pour commencer, nous dresserons un panorama rapide des hypothèses qui ont été faites à propos du rôle de la structure de l’information dans l’emploi de SVQ (§ 2.1) et nous détaillerons également en quoi il est intéressant de considérer les principes de ‘End-Weight’ et ‘End-Focus’ (§ 2.2). Nous présenterons ensuite l’étude de Coveney (Reference Coveney1995) et sa méthodologie (§ 3). Dans un troisième temps, nous décrirons nos données et présenterons le protocole adopté pour l’analyse des variantes de l’interrogation partielle (§ 4). Dans un quatrième temps, nous exposerons nos résultats, tout en les confrontant à ceux de Coveney (Reference Coveney1995) (§ 5-6). Enfin, cette étude se terminera par quelques réflexions générales à propos d’éventuels liens entre l’emploi de SVQ et la structure de l’information (§ 7).
2. L’INTERROGATIVE IN SITU ET LA STRUCTURE DE L’INFORMATION
2.1. Hypothèses principales
Plusieurs travaux semblent suggérer que le français contemporain, du moins tel qu’il est pratiqué dans une interaction informelle, connaît une forte croissance dans l’usage de SVQ. Premièrement, dans ses données de films des années 1930-2009, Farmer (Reference Farmer2015 : 480) montre que l’emploi de SVQ progresse tout au long du 20e siècle. Deuxièmement, quelques études récentes effectuées sur les corpus de français parlé montrent que l’emploi de SVQ domine de loin celui des autres variantes et peut couvrir à elle seule autour de 40-60% de tous les usages des interrogatives partielles (Quillard Reference Quillard2000; Huková Reference Huková2006; Hamlaoui Reference Hamlaoui, Clarkson, Absi, Ogawa, Ono, Patterson and Villafana2010; Adli Reference Adli, Adli, García García and Kaufmann2015; Baunaz et Bonan, Reference Baunaz and Bonan2023). Enfin, en français d’aujourd’hui, SVQ tend à investir les interrogatives indirectes : p. ex. je sais plus c’est où (Gardner-Chloros et Secova Reference Gardner-Chloros and Secova2018; Ledegen et Martin Reference Ledegen and Martin2020; Ledegen Reference Ledegen2023). Parmi les multiples explications avancées afin de rendre compte de l’emploi de SVQ, certains ont fait l’hypothèse – formulée avec différentes nuances – d’un rapport avec la structure informationnelle (Coveney Reference Coveney1989, Reference Coveney1995; Le Goffic, Reference Le Goffic1993 : 110; Chang Reference Chang1997; Cheng et Rooryck Reference Cheng and Rooryck2000; Beyssade Reference Beyssade2006; Lefeuvre Reference Lefeuvre2006; Myers Reference Myers2007; Hamlaoui Reference Hamlaoui, Clarkson, Absi, Ogawa, Ono, Patterson and Villafana2010, Reference Hamlaoui2011; Garassino Reference Garassino2022, Rosemeyer Reference Rosemeyer2023). Nous avons synthétisé quelques propos de ces auteurs sous forme d’une liste d’hypothèses (Tabl. 2).
Ci-dessous, nous présenterons rapidement le concept de structure informationnelle et deux de ses principes : ‘End-Focus’ et ‘End-Weight’, dont nous examinerons ci-après le rôle dans la sélection de SVQ.
2.2. Principes de ‘End-Weight’ et ‘End-Focus’
Les travaux de Lambrecht (Reference Lambrecht1981, Reference Lambrecht1994, Reference Lambrecht and Ungeheuer2001) sur la structure informationnelle ont établi que les interactants, selon leurs besoins pragmatiques, disposent de plusieurs façons de présenter les informations qu’ils communiquent : “[…] the information structure of a sentence is the formal expression of the pragmatic structuring of a proposition in a discourse” (Leino Reference Leino, Hoffmann and Trousdale2013, en référence à la définition proposée par Lambrecht, Reference Lambrecht1994 : 5). Ainsi, un contenu relativement neutre tel que Paul habite à Paris peut être présenté différemment sur le plan informationnel :
Les besoins pragmatiques des interactants peuvent varier, mais ils sous-tendent mutatis mutandis quatre principes dans la structuration informationnelle du discours, à savoir : “the given-before-new principle, the end-focus principle, the end-weight principle, and the complexity principle” (Hilpert, Reference Hilpert, Aarts, MacMahon and Hinrichs2021 : 231). Le premier principe (given-before-new) stipule que les informations anciennes tendent à précéder celles qui sont plus récentes (cf. Halliday, Reference Halliday1967 : 205; Hilpert, Reference Hilpert, Aarts, MacMahon and Hinrichs2021 : 232); selon le deuxième principe (end-focus), les informations les plus importantes ou saillantes (celles qui excèdent l’état actuel du savoir partagé) se placent ordinairement à la fin d’un énoncé (Hilpert, op. cit. : 234); le troisième principe (end-weight) veut que les constituants lourds ou complexes apparaissent de préférence à la fin d’un énoncé (op. cit. : 234-235); enfin, selon le quatrième principe (complexity), plus les productions linguistiques sont complexes sur le plan cognitif, plus elles auront de chances d’être encodées par des options grammaticales plus explicites (cf. Rohdenburg, Reference Rohdenburg1996 : 151; Hilpert, op. cit. : 236). À noter que tous ces principes ont ceci de commun qu’ils sont censés faciliter sur le plan cognitif les procédures d’encodage/décodage de l’information.
Dans ce travail, suite à l’étude de Coveney (Reference Coveney1995), nous examinerons le poids des contraintes de ‘End-Weight’ et ‘End-Focus’ sur l’emploi de l’interrogative SVQ. Telles que formulées par Coveney (Reference Coveney1995 : 149), les deux hypothèses sont les suivantes :
Hypothèse de ‘End-Weight’ : plus la proforme Q sera longue, plus le locuteur sera amené à choisir SVQ au détriment de Q ex situ;
2. Moins la partie SVC de l’interrogative est informative, plus le locuteur sera amené à choisir SVQ au détriment de Q ex situ (‘End-Focus’).
L’hypothèse de ‘End-Weight’ ou celle de « permutation de longueur » (Berrendonner Reference Berrendonner1987) stipule donc que le locuteur aura tendance à opter pour une structure SVQ lorsque Q est un constituant relativement lourd (c’est-à-dire plus long en syllabes). À son tour, l’hypothèse de ‘End-Focus’ stipule que le locuteur aura tendance à opter pour SVQ lorsque dans un énoncé interrogatif le mot Q s’avérera plus informatif que la partie SVC (Sujet-Verbe-Complément). Mais si une interrogation partielle contient par défaut un élément Q, sous-spécifié et partant proéminent, qui cherche à établir l’alternative la plus pertinente parmi les autres (ex. Quand aura-t-on des nouvelles ? – Demain. En tout cas, pas aujourd’hui), l’hypothèse de ‘End-Focus’ suggère néanmoins qu’on aura plus de chances d’avoir une partie SVC moins informative avec l’interrogative in situ qu’avec l’interrogative ex situ (Coveney, op. cit. : 147) :
[…] adapting the End-Focus maxim somewhat, we could reasonably hypothesise that, in instances of SVQ, the rest of the clause (which we will refer to as SVC, representing Subject + Verb + (Complement)) is less informative than is the case in the other, QU-fronted structures.
À noter que les deux hypothèses ont été également considérées dans l’étude de Hamlaoui (Reference Hamlaoui, Clarkson, Absi, Ogawa, Ono, Patterson and Villafana2010; cf. Li, Reference Li2021 : 56) qui a analysé l’emploi de SVQ dans les données orales; nous évoquerons les résultats qu’elle a obtenus, en plus des résultats de Coveney (Reference Coveney1995), lorsque nous ferons quelques remarques d’ordre général, dans notre conclusion (infra § 7), sur d’éventuels liens entre la structure de l’information et la sélection de SVQ.
3. ÉTUDE DE COVENEY (Reference Coveney1995)
L’analyse de Coveney a porté sur 1113 occurrences d’interrogatives partielles en provenance du corpus « the York Child Language Survey » (Freeth Reference Freeth1972); 116 occurrences (10,5%) ont été réalisées par l’interrogative SVQ. Les données consistaient en enregistrements de conversations entre le personnel enseignant d’écoles et les adolescents français en provenance de différents milieux socioéconomiques. Coveney applique l’approche variationniste, dont l’hypothèse centrale assume que plusieurs variantes forment une variable et représentent plusieurs façons dans l’expression du « même sens » (Sankoff Reference Sankoff and Newmeyer1988; Coveney Reference Coveney1997). En accord avec ce postulat, il procède à l’examen d’une diversité de contraintes linguistiques et pragmatiques qui pourraient s’avérer, en termes probabilistes, importantes dans la sélection de SVQ. Afin d’évaluer correctement le poids des facteurs examinés, Coveney écarte de son analyse les séquences discursives qui n’admettent que des variantes spécifiques, n’étant pas interchangeables avec SVQ (4-5), ou encore les emplois qui ne sont pas syntaxiquement complets (6) :
De même, Coveney élimine les contextes catégoriques (CC, Tabl. 3), lesquels rendent toute interchangeabilité entre variantes caduque pour des raisons d’ordre grammatical : soit ils interdisent l’emploi de SVQ, soit ils n’acceptent pas l’emploi d’autres variantes ex situ; tous les exemples cités dans le Tabl. 3 sont de Coveney (Reference Coveney1995), les remarques étant les nôtres.
Par la suite Coveney retient 845 occurrences des interrogatives partielles, dont 12,8% d’occurrences de SVQ, ce qui ferait selon nos propres calculs 108 emplois de cette forme interrogative.
Enfin, pour tester l’incidence des principes de ‘End-Weight’/‘End-Focus’ sur l’emploi de SVQ, Coveney (Reference Coveney1995 : 154) procède au codage des paramètres suivants : (i) longueur en syllabes de la proforme Q, (ii) longueur en syllabes de la partie SVC, (iii) Sujet, (iv) Verbe, (v) Complément verbal, (vi) identité du mot Q.
4. ÉTUDE DES VARIANTES DE L’INTERROGATION PARTIELLE DANS LE CORPUS SUISSE DE SMS
Le Corpus suisse de SMS (dorénavant ‘SwissSMS’) compte 25947 messages, rédigés essentiellement dans les langues nationales suisses : suisse allemand, allemand standard (Hochdeutsch), français, italien et romanche (Stark, Ueberwasser et Ruef Reference Stark, Ueberwasser and Ruef2009-2015). S’agissant du sous-corpus français, qui nous a servi ici de base empirique, il comprend 4619 messages. Selon les informations mises en ligne par le projet sms4science (Ueberwasser Reference Ueberwasser2015-2022), les textos ont été légués par 2784 donateurs; 1316 d’entre eux ont participé à une enquête sociolinguistique et ont envoyé 20413 SMS. Parmi ces 1316 participants, âgés de 12 à 77 ans, 46% avaient entre 20 et 29 ans et 64% étaient des femmes; de plus, 257 participants ont déclaré avoir le français pour langue maternelle. Tous les exemples, accessibles via le lien <sms.linguistik.uzh.ch>, sont cités ici avec leurs graphies d’origine et accompagnés de leur code chiffré.
L’annotation des données en provenance du sous-corpus français a dégagé quelques 425 occurrences de structures interrogatives partielles (Tabl. 4).
Dans nos données, l’emploi de SVQ domine de loin les autres variantes et apparaît dans plus de la moitié des cas. Les tendances observées ici, même si elles concernent les écrits SMS, corroborent donc celles établies pour le français parlé (supra § 2.1) : la variante SVQ est de loin dominante. À noter toutefois qu’à la différence des corpus oraux, les écrits électroniques semblent attester d’une plus grande variabilité dans l’emploi de moyens grammaticaux : d’un côté, on constate un nombre important d’interrogatives par inversion du clitique dans les données SMS (Tabl. 4, Guryev Reference Guryev, Behr and Lefeuvre2019; Guryev et Delafontaine Reference Guryev and Delafontaine2015, Reference Guryev and Delafontaine2022); d’un autre côté, la variabilité importante dans le déploiement de moyens grammaticaux est aussi attestée en anglais (Tagliamonte et Denis Reference Tagliamonte and Denis2008) ou en japonais (Nishimura Reference Nishimura, Bolly and Degand2013). Ceci s’expliquerait par le fait que les écrits électroniques, en tant que mode d’interaction, représentent une combinaison de paramètres caractérisant à la fois la distance et l’immédiat communicatif (Koch et Œsterreicher Reference Koch and Œsterreicher2001).
Le codage des structures de l’interrogation partielle (ex. 7) consistait à :
-
a. identifier la variante de l’interrogation sous laquelle a été réalisé un énoncé interrogatif;
-
b. documenter les paramètres morphosyntaxiques des constituants Sujet, Verbe, Complément, Mot Q;
-
c. calculer la longueur de la séquence SVC précédant l’élément Q (infra § 5.2).
Enfin, afin de procéder au tri des donnés, nous avons appliqué les critères proposés par Coveney (Reference Coveney1995) en écartant dans un premier temps les emplois qui « bloquent » toute variabilité (supra Tabl. 3). À noter toutefois que si nous avons éliminé les structures à Q sujet (ex. Qui est-ce qui parle ?) qui ne sont pas interchangeables avec SVQ, nous avons cependant gardé deux occurrences de structures, réalisées sous la variante QESV (8), qui sont potentiellement transformables avec SVQ en séquences impersonnelles (9) :
Dans un deuxième temps, nous avons écarté certains emplois d’interrogatives avec Q comment qui fonctionnent comme des expressions semi-figées telles que : comment ça va ?/comment vas-tu ? D’une part, dans le contexte du texto, ce type d’emplois fonctionne habituellement comme des activités socio-interactionnelles préliminaires à caractère ritualisé, ayant pour but d’ouvrir un espace conversationnel (Auer, Reference Auer2002 : 9); d’autre part, il a été majoritairement réalisé avec QSV et QV-Scl. De plus, nous avons éliminé un cas ambigu, tel que (10) :
Suite au tri des données, nous avons obtenu 325 occurrences d’interrogatives partielles, dont 217 emplois de SVQ (66,8%) (Tabl. 5).
Ci-dessous, nous testerons l’hypothèse de Coveney (Reference Coveney1995), selon laquelle les contraintes d’ordre informationnel, telles que ‘End-Weight’ et ‘End-Focus’, auront une incidence sur la sélection de l’interrogative SVQ. Les résultats de notre examen seront en même temps confrontés à ceux de Coveney (Reference Coveney1995), ce qui nous permettra d’arriver à certaines généralisations et d’évaluer l’hypothèse informationnelle; même si les données de Coveney (Reference Coveney1995) proviennent du français parlé et les nôtres sont des écrits électroniques (Stark, Ueberwasser et Ruef Reference Stark, Ueberwasser and Ruef2009–2015).
5. L’INCIDENCE DE ‘END-WEIGHT’ SUR LA SELECTION DE SVQ
5.1. Résultats de Coveney (Reference Coveney1995)
À titre de rappel, selon l’hypothèse de ‘End-Weight’, la préférence sera donnée à SVQ et non à une variante ex situ, lorsque la proforme Q donne lieu, en nombre de syllabes, à des séquences longues. Si nous regardons maintenant les résultats de Coveney (Reference Coveney1995 : 156), cette hypothèse s’avère nettement confirmée : l’emploi de SVQ tend à devenir plus important à mesure que le mot Q gagne en longueur et atteint plus de 30% d’emplois avec un Q composé de 4 syllabes ou plus (Tabl. 6).
De la contrainte régie par le principe de ‘End-Weight’ résulte simultanément un autre effet intéressant : l’emploi de SVQ devrait être également favorisé lorsque la partie SVC de l’interrogation constitue une unité relativement courte. Ce dernier postulat est en accord avec la loi de Menzerath-Altmann (Menzerath Reference Menzerath1928; Altmann Reference Altmann and Grotjahn1980; Cramer Reference Cramer, Köhler, Altmann and Piotrowski2005), selon laquelle, en termes probabilistes, “the mean clause length decreases with the increasing sentence length” (Čech, Benešová et Mačutek, Reference Čech, Benešová and Mačutek2022 : 3). En termes techniques, comparée à sa réalisation non-interrogative où elle n’est suivie par aucun mot Q, c’est-à-dire [SVC+Ø], la construction abstraite SVC réalisée sous la variante de SVQ commence à s’associer à des productions relativement longues ([SVC]+Q), ceci menant potentiellement à une diminution de la partie [SVC]. Les résultats de Coveney confirment cette tendance : l’emploi de SVQ a plus de chances d’apparaître dans les configurations à SVC court constitué de une ou deux syllabes (Tabl. 7).
Cependant, cette tendance perd son effet à partir du moment où la longueur de SVC est celle de trois syllabes ou plus, si bien que, finalement, un nombre non-négligeable d’emplois à SVC long, constitué de quatre syllabes ou plus, sont réalisés avec SVQ (Coveney, Reference Coveney1995 : 166). Mais il est intéressant de noter tout de même que l’effet de la contrainte de ‘End-Weight’ est encore amplifié dans les données de Coveney lorsque les séquences de Q long sont combinées à celles de SVC court : “[…] broadly speaking, the shorter the SVC, and the longer the QU element, the greater is the frequency of use of the SVQ structure” (op. cit. : 158). Cette observation corrobore alors la loi de Menzerath-Altmann évoquée ci-dessus.
5.2. L’incidence de ‘End-Weight’ sur SVQ dans les données du SwissSMS
À l’instar de l’étude de Coveney (Reference Coveney1995), nous avons donc analysé l’incidence de la longueur de Q et celle de la longueur de SVC sur l’occurrence de SVQ. De prime abord, les résultats que nous avons obtenus sont plus ambigus que ceux de Coveney (Tabl. 8).
D’un côté, l’emploi de SVQ semble favorisé dans les configurations à Q long (trois syllabes ou plus). Mais d’un autre côté, son emploi domine également dans les configurations à Q composé d’une syllabe; en revanche, l’emploi de SVQ est plus rare avec un Q constitué de deux syllabes. Cependant, si l’on tient compte du fait que SVQ domine de loin les autres variantes dans nos données (après le tri : 66,8% d’emplois vs 12,8% d’emplois pour les données de Coveney), on peut s’attendre à ce que, quel que soit le contexte linguistique, son usage soit celui par défaut. Dans le même temps, les différences que nous observons (Tabl. 8) dans la distribution de SVQ entre les deux configurations – [Q composé d’une syllabe] vs [Q composé de trois syllabes ou plus]Footnote 1 – sont assez notables : 85,9% d’emplois de SVQ pour la deuxième vs 71,8% d’emplois de SVQ pour la première (Tabl. 8). Le test de chi-carré, appliqué aux données (Tabl. 8), suggère également que la différence dans l’emploi des variantes selon la longueur de Q est significative : x2 = 42,22; df = 3; p < 0,00001 (Preacher Reference Preacher2001).
Reste à savoir pourquoi à la différence des résultats de Coveney (Reference Coveney1995), l’emploi de SVQ est également important dans nos données avec un Q composé d’une syllabe, alors que son emploi est relativement faible avec un Q constitué de deux syllabes. Comme nous l’avons déjà évoqué, cela pourrait être la particularité de nos données, dans lesquelles SVQ est de loin la variante la plus usuelle, si bien que quelle que soit l’identité du mot Q c’est cette variante qui tend à être sélectionnée en premier lieu. En effet, si nous nous intéressons à l’identité du Q composé de deux syllabes, nous constaterons que l’emploi de SVQ n’est plus dominant seulement avec le mot comment, mais son emploi reste toujours dominant avec d’autres mots Q (Tabl. 9).
Dans nos données, l’emploi du mot comment apparaît de préférence avec QV SN (11), suivi par ses emplois avec QSV (12) et SVQ (13), et en dernier lieu par son emploi avec QV-Scl (14) (Tabl. 10) :
De plus, comme on l’a vu supra § 3-4 (Tabl. 3), l’emploi de SVQ apparait rarement avec pourquoi, dont les occurrences ont été éliminées lors du tri des données. Au vu de ces observations, on peut conclure que l’identité de Q a bel et bien une incidence sur le choix de variantes, quand bien même l’emploi de SVQ tend de manière générale à être favorisé avec un Q long (infra § 5.3 pour les discussions). En somme, plusieurs facteurs concourent à la sélection des variantes.
S’agissant de l’incidence de la séquence SVC, lors du calcul de sa longueur, nous avons uniquement compté la partie de l’énoncé qui précède l’emploi du mot Q (Coveney, Reference Coveney1995 : 157). Enfin, si le mot Q précédait potentiellement, en termes transformationnels, le Complément – ce qui n’est pas rare avec l’emploi de SVQ comme en (15)Footnote 2 – notre calcul de la longueur de SVC avec variantes ex situ s’arrêtait juste avant la montée hypothétique maximale de Q dans sa réalisation in situ. Conformément à ces principes, en (15) la longueur de SVC est de trois syllabes : elle a fait.
Enfin, lors du calcul de la longueur de SVC, nous n’avons pas tenu compte des éléments parenthétiques ou périphériques qui font habituellement preuve d’une certaine mobilité syntaxique (marqueurs discursifs, renforçateurs, éléments disloqués, adverbiaux et autres éléments extraprédicatifs, etc.). À noter que nous sommes conscients qu’étant donné la complexité de certaines productions, le calcul fait l’objet d’une certaine subjectivité. Il n’empêche que nos résultats confirment ceux de Coveney (Reference Coveney1995) : l’emploi de SVQ est fortement favorisé avec les séquences de SVC courtes (deux syllabes ou moins), et de manière générale il régresse à mesure que SVC gagne en longueur (Tabl. 11). Le test de chi-carré suggère aussi que les différences observées dans l’emploi de SVQ selon la longueur de SVC sont significatives : x2 = 36,478; df = 4; p < 0,00001.
De surcroît, à l’instar des résultats de Coveney, l’effet du facteur dit ‘End-Weight’ devient accentué dans nos données, lorsqu’on a affaire à des configurations où les séquences de SVC courtes (une ou deux syllabes) sont combinées à celles de Q longs (trois syllabes ou plus) : sur 33 cas de cette configuration (16-17), nous avons 30 occurrences de SVQ (90,9%).
5.3. Ultimes remarques
Nos résultats confirment ceux de Coveney (Reference Coveney1995) et valident par conséquent le poids de la contrainte de ‘End-Weight’ dans la sélection de SVQ : (a) son emploi est favorisé avec le mot Q long, et de plus (b) il a tendance à aller de pair avec les séquences de SVC courtes constituées de une ou deux syllabes. Certes, dans nos données l’emploi de SVQ apparaît aussi avec les mots Q courts (une syllabe), étant dominant par défaut quel que soit le contexte d’usage. Mais il est remarquable d’observer dans nos données et celles de Coveney (op. cit.) une interaction importante entre les facteurs (a) et (b) : lorsqu’ils agissent en unisson pour donner lieu à une configuration [SVC court + Q long], cela augmente significativement les chances d’apparition de SVQ. Dans les données SMS, ladite configuration – [SVC=‘1-2 syllabes’ + Q=‘3 syllabes ou plus’] – débouche quasi-systématiquement sur l’emploi de SVQ, réduisant drastiquement toute variabilité dans la sélection de variantes ex situ (moins de 10% des chances).
Enfin, il faut admettre que le poids de Q est aussi à relativiser, dans la mesure où la nature de Q a une incidence sur le choix des variantes (Guryev Reference Guryev2017). Tout d’abord, si dans plusieurs travaux on observe que l’emploi de SVQ est favorisé par les séquences de SVC peu informatives (Coveney, Reference Coveney2002 : 222; Hamlaoui, Reference Hamlaoui, Clarkson, Absi, Ogawa, Ono, Patterson and Villafana2010 : 4; Dekhissi Reference Dekhissi2013), le poids de Q n’a pas d’effet important dans une autre étude de Coveney (Reference Coveney2002 : 221), ou encore dans celle de Dekhissi (Reference Dekhissi2013). Deuxièmement, notre étude et plusieurs autres montrent que les mots bisyllabiques comme pourquoi et comment sont largement employés en position ex situ (Coveney, Reference Coveney2002 : 221; Dekhissi Reference Dekhissi2013; Lefeuvre et Rossi-Gensane Reference Lefeuvre and Rossi-Gensane2015; cf. Li, Reference Li2021 : 51). De plus, nous observons dans nos données (Tabl. 12; infra Tabl. 5 pour le rappel des variantes), ainsi que dans celles de Quillard (Reference Quillard2000 : 97) et Dekhissi (Reference Dekhissi2013), que l’emploi de SVQ est extrêmement fréquent avec les mots Q courts comme où, quoi et (en dehors de l’étude de Dekhissi op. cit.) quand.
Cela dit, si le poids de Q en tant que facteur ne permet de dresser qu’une partie du tableau, on ne saurait non plus négliger son apport : par exemple, nos données montrent clairement que l’emploi de SVQ tend à aller de pair avec les mots quel N (18) et Q multiples (19) (Tabl. 12), les deux formant des séquences relativement longues :
De surcroît, l’emploi de SVQ favorisé par des Q courts (comme où, quoi et quand) peut être dû au fait que ses usages semblent associés à des contextes fortement présupposés; les interlocuteurs, dans un contexte d’interaction par textos, accèdent en grande partie à des références communes et interrogent souvent à des fins de coordination d’activités mutuelles (ex. 18, infra ex. 23-27; cf. § 6.4). La valeur présupposée de SVQ, à côté de ses emplois à valeur de questions retardées (ex. Il faut aller… où ? En France), serait constitutive de ses premières occurrences en diachronie (Larrivée Reference Larrivée2019a, b; Guryev et Larrivée Reference Guryev and Larrivée2021). Bien que l’emploi présupposé, comme en (18), ne soit plus le trait catégorique de SVQ, il semble néanmoins encore très fréquent en français contemporain (Garassino Reference Garassino2022; Rosemeyer Reference Rosemeyer2023).
6. L’INCIDENCE DE ‘END-FOCUS’ SUR LA SELECTION DE SVQ
6.1. L’incidence de la séquence SVC
À titre de rappel, l’hypothèse de ‘End-Focus’ fait la prédiction suivante : moins la séquence SVC sera informative, plus on verra le locuteur opter pour la variante SVQ, le constituant renfermant l’information saillante (non-spécifiée dans le cas de Q) se plaçant ordinairement à la fin d’un énoncé à des fins d’optimisation pragmatique des procédures d’encodage/décodage. Ce principe s’avère en partie déjà validé dans nos données et celles de Coveney (Reference Coveney1995) puisque dans les deux études l’emploi de SVQ devient plus important avec les séquences de SVC courtes constituées de une ou deux syllabes qu’avec les séquences de SVC plus longues (Tabl. 7 et 11). Certes, les séquences de SVC courtes peuvent être interprétées par défaut comme peu informatives si l’on se réfère au principe d’économie dans le codage des informations : établi à partir des observations d’ordre typologique, ce principe postule que les formes linguistiques dont l’usage s’associe à des significations prévisibles tendent à être exprimées par les séquences plus courtes : « Speakers can afford to use short [forms] or zero coding for predictable meanings, but they have to make a greater coding effort for unpredictable meanings » (Haspelmath, Reference Haspelmath2021 : 624). En d’autres termes, si les séquences de SVC courtes favorisent l’emploi de SVQ, c’est qu’elles codent en général les informations prévisibles, le constituant Q – qui renvoie à des informations rhématiquement pertinentes (quoique non-spécifiées) – se plaçant alors, selon le principe de ‘End-Focus’, à la fin d’un énoncé interrogatif.
Ci-dessous, à l’instar de l’étude de Coveney (Reference Coveney1995), nous examinerons le rôle de trois constituants : Sujet, Verbe et Complément, dans l’informativité de SVC. Autrement dit, l’apport de la séquence SVC, dont est constituée la question réalisée par SVQ, tend-il à être ‘informativement riche’ ou, comme le prédit le principe de ‘End-Focus’, ‘peu informatif’ ?
6.2. L’incidence du Sujet
Coveney (Reference Coveney1995 : 159) fait l’hypothèse que contrairement aux sujets lexicaux qui sont plus informatifs, les clitiques sujets, y compris les pronoms démonstratifs non-clitiques (ça/cela), favorisent davantage l’emploi de SVQ, du fait même que la référence de ces éléments, déictiques ou anaphoriques, s’établit plus facilement. L’hypothèse de Coveney est entièrement validée dans nos données (Tabl. 13) : alors que le sujet pronominal favorise l’emploi de SVQ, le sujet SN apparaît seulement dans 13,5% des cas avec SVQ. Le test de chi-carré confirme la significativité des différences observées : x2=53,371; df=1; p < 0,00001.
Cependant, les résultats obtenus par Coveney sont moins évidents : les sujets SN favorisent plus l’emploi de SVQ que les sujets pronominaux (Tabl. 14).
En même temps, Coveney (op. cit.) émet quelques réserves sur ces résultats. Premièrement, les emplois de SVQ avec sujet SN comptent seulement huit occurrences, si bien qu’il est difficile de généraliser ces résultats. Deuxièmement, on compte cinq cas qui renferment Q long, sachant le poids relativement important de ce facteur dans le choix de SVQ (20) :
Troisièmement, on y retrouve deux constructions attributives (21), dont l’emploi devient agrammatical avec un QV SN (22), variante couramment utilisée avec sujet SNFootnote 3 (Coveney, op. cit. : 160) :
Par ailleurs, dans les données de Coveney, les huit occurrences de sujets SN avec SVQ renvoient à des informations faisant partie du savoir partagé (20-21), donc facilement identifiables sur le plan référentiel (op. cit. : 160). C’est également le cas pour le SwissSMS où les cinq occurrences de sujets SN avec SVQ (23-27) réfèrent aux informations précédemment établies dans le savoir partagé; en témoigne par exemple l’usage de déterminants définis ou possessifs avec les noms concernés :
En résumé, dans le SwissSMS, l’emploi de SVQ est favorisé lorsque le sujet est pronominal (clitique pour la plupart du temps, mais aussi quelquefois proSN : cela/ça). En revanche, dans l’étude de Coveney (Reference Coveney1995), ce facteur s’est avéré sans incidence. Enfin, les deux études montrent que lorsqu’il est employé avec SVQ, le sujet SN encode des informations anciennes.
6.3. L’incidence du Complément
Coveney (Reference Coveney1995 : 161) observe que l’usage de SVQ tend à être favorisé avec complément « zéro », tandis que la présence d’un complément – sous sa forme pronominale (clitique ou proSN : cela/ça) ou sous sa forme lexicale (SN, SPrép, adverbiaux, infinitifs, clauses subordonnées, etc.) – tend à favoriser l’emploi de variantes ex situ (Tabl. 15).
Le fait que le complément « zéro » favorise dans les données de Coveney l’emploi de SVQ corrobore l’hypothèse de ‘End-Focus’, l’apport de la séquence SVC étant en effet moins informatif lorsque le complément est absent. Toutefois, comme l’admet Coveney, le poids des contraintes dues à la nature du complément doit être relativisé, les effets observés dans ce sens étant relativement modestes (1995 : 161) :
[…] there is a relatively modest effect in the expected direction: i.e. that a zero complement (which obviously reduces the overall ‘informativeness’ of the SVC) correlates with a slightly stronger tendency to use SVQ, whereas the presence of a complement favours a QU-fronted structure.
De plus, si nous appliquons le test de chi-carré aux données de Coveney (Tabl. 15), nous obtenons un tableau assez curieux : le rôle du complément y est significatif à condition que p < 0,05, le test échouant avec p < 0,01 : x2 = 8,887; df = 2; p = 0,011755. En d’autres termes, comme le souligne lui-même Coveney (op. cit.), l’incidence du complément sur la sélection de SVQ est plutôt modeste.
Les tendances observées dans les données du SwissSMS sont encore plus éloquentes : le complément – qu’il s’agisse de sa forme « zéro », pronominale ou lexicale – n’a aucun effet sur l’emploi de SVQ (Tabl. 16) : x2 = 2,861; df = 2; p = 0,239189.
En bref, dans les données de Coveney (Reference Coveney1995), le complément « zéro » a une légère tendance à favoriser l’emploi de SVQ, là où le poids des paramètres du complément s’avère sans effet dans le SwissSMS.
6.4. L’incidence du Verbe
S’agissant de l’incidence des paramètres verbaux, Coveney (Reference Coveney1995 : 160-161) observe que comparé aux verbes lexicaux qui sont en règle générale plus informatifs, le verbe copule être, mais aussi l’emploi de formes verbales telles que (il) y a et avoir X ans/quel âge, favorise de loin l’usage de SVQ (Tabl. 17).
De notre côté, compte tenu des spécificités de l’interaction par SMS, nous avons distingué quatre classes de verbes : être, faire Footnote 4 , verbes de déplacement (aller, venir, monter, passer, partir, rentrer, etc.), et tout autre verbe. En ce qui concerne les formes (il) y a et avoir X ans/quel âge, qui ont été classées par Coveney dans la même case avec la copule être, nous n’avons qu’une occurrence de (il) y a dans nos données; par conséquent, nous l’avons classée avec le reste des verbes (rubrique « autre verbe »). Nos résultats montrent que dans le SwissSMS, le verbe s’avère un facteur significatif dans l’emploi de SVQ (Tabl. 18) : x2 = 47,599; df = 3; p < 0,00001.
À l’image des données de Coveney, le verbe être favorise clairement l’emploi de SVQ. De plus, nos données suggèrent qu’il est fortement favorisé par le verbe faire, mais surtout par les verbes de déplacement (aller, venir, monter, passer, partir, rentrer, etc.), dont l’emploi va quasi-constamment de pair avec SVQ. Ceci est sans doute lié au fait que l’interaction par SMS implique une proximité psychosociale entre interactants qui partagent un nombre important de références et informations suite aux activités communes qu’ils pratiquent au quotidien (Anis, Reference Anis2007 : 94). En effet, dans les messages SMS, les emplois du verbe faire et de verbes de déplacement apparaissent souvent dans les contextes interactionnels à haut degré de présupposition, comme en (28-32), lesquels impliquent sur le plan pragmatique qu’une bonne partie des informations fait partie du savoir partagé des interactants :
De fait, l’usage important de SVQ dans les écrits SMS pourrait être lié aux spécificités de cette interaction : L1 et L2 accédant à une bonne partie des références et connaissances communes, l’interrogation porte souvent sur des contenus antérieurement validés dans le savoir partagé.
En résumé, dans les deux études, les paramètres verbaux ont une incidence sur l’emploi de SVQ : celui-ci est favorisé avec les verbes sémantiquement peu informatifs, tels que le verbe copule être Footnote 5 , ou encore avec faire et les verbes de déplacement, dont l’emploi serait souvent associé à des contextes fortement présupposés.
7. EN GUISE DE CONCLUSION
Dans cette étude, qui s’inspire du travail de Coveney (Reference Coveney1995), nous avons examiné l’incidence de la structure informationnelle, à travers les contraintes dites ‘End-Weight’ et ‘End-Focus’, sur la sélection de l’interrogative SVQ. De manière générale, nos résultats corroborent ceux obtenus par Coveney. Les deux études montrent que l’emploi de SVQ est favorisé par les mots Q longs, même si le facteur de ‘End-Weight’ est à relativiser pour nos données. Le plus remarquable demeure que dans les deux études l’emploi de SVQ est davantage favorisé lorsque les mots Q longs figurent avec des séquences de SVC courtes. En outre, les deux études valident plutôt l’hypothèse de ‘End-Focus’ : l’usage de SVQ est favorisé avec les séquences de SVC relativement courtes, et il tend à apparaître avec les verbes peu informatifs, tels que être, ou encore avec les verbes, comme faire ou ceux de déplacement (aller, venir, rentrer, etc.), dont l’emploi s’associe à des contextes fortement présupposés.
Si nous retenons les configurations qui s’avèrent les plus propices à l’emploi de SVQ dans le SwissSMS, nous aurons le tableau suivant (Tabl. 19).
Alors que l’incidence de la configuration (i) se confirme dans notre étude et celle de Coveney (Reference Coveney1995), elle n’est pas validée dans les études de Coveney (2002) et Dekhissi (Reference Dekhissi2013). Les données de Hamlaoui (Reference Hamlaoui, Clarkson, Absi, Ogawa, Ono, Patterson and Villafana2010 : 4; Li, Reference Li2021 : 49), bien qu’elles contiennent un nombre relativement modeste de ces occurrencesFootnote 6 , semblent néanmoins confirmer le poids de Q dans la sélection de SVQ : sur 32 emplois de Q composé de trois syllabes ou plus, 27 occurrences sont réalisées par SVQ (84,4%). Enfin, si le poids du mot Q est à relativiser dans nos données, cela n’annule pas pour autant le fait qu’il y a une interaction entre les deux facteurs, [‘SVC court’ + ‘Q long’] : nous trouvons pertinent que la combinaison des deux facteurs favorise significativement l’emploi de SVQ dans les données de Coveney (Reference Coveney1995) et dans celles du SwissSMS; par exemple, s’agissant de nos données, ladite configuration (iii) (Tabl. 19) s’associe à l’emploi de SVQ dans plus de 90% des cas. En termes d’importance, cette tendance est juste derrière une autre tendance : à savoir la configuration (vi) (Tabl. 19), où l’emploi de verbes de déplacement apparaît dans 97,4% des cas avec SVQ.
Si plusieurs des tendances dégagées dans cette étude ont été déjà établies par Coveney (Reference Coveney1995), en l’occurrence les tendances (i-iv) (Tabl. 19), elles sont davantage renforcées dans le SwissSMS et font désormais partie des environnements morphosyntaxiques à variabilité faible : dans nos données, elles débouchent quasi-systématiquement sur l’emploi de SVQ (dans plus de 80% des cas, Tabl. 19), réduisant donc drastiquement les chances d’apparition de toute autre variante. De surcroît, la validité des tendances (i, ii, iv et v) semble aussi confirmée dans l’étude de Hamlaoui (Reference Hamlaoui, Clarkson, Absi, Ogawa, Ono, Patterson and Villafana2010; cf. Li, Reference Li2021 : 48-56) qui observe qu’en français parlé, elles donnent lieu à l’emploi de SVQ dans plus de 80% des cas.Footnote 7
Enfin, comment expliquer que plusieurs des tendances, observées par Coveney (Reference Coveney1995) dans leur forme plutôt modérée, prennent la forme plus extrême dans nos données et celles de Hamlaoui (Reference Hamlaoui, Clarkson, Absi, Ogawa, Ono, Patterson and Villafana2010) ? La réponse pourrait être la suivante : les données analysées par Coveney (Reference Coveney1995) proviennent d’un corpus collecté entre 1964 et 1967Footnote 8 ; et l’emploi de SVQ a connu un progrès important depuis ce temps, du moins tel qu’il est attesté en français informel d’aujourd’hui. En effet, on compte 116 emplois de SVQ (10,5%) sur 1113 occurrences d’interrogatives partielles dans les données de Coveney (op. cit., “the York Child Language Survey”, Freeth Reference Freeth1972). En revanche, on compte 47,3% des cas de SVQ (105 occurrences sur 222) dans les données de Hamlaoui (Reference Hamlaoui, Clarkson, Absi, Ogawa, Ono, Patterson and Villafana2010) et 52,9% (225 occurrences sur 425) dans le SwissSMS (2009-2015). De surcroît, l’examen de plusieurs bases de données suggère que l’emploi de SVQ connaît une montée sans précédent dans la deuxième moitié du 20e siècle; c’est notamment le cas pour les données de Farmer (corpus de films, 2015 : 474-476), Dekhissi (corpus de films, 2013 : 138) et Baunaz et Bonan (Reference Baunaz and Bonan2023, corpus de français parlé ESLO 1-2). Enfin, si nous nous intéressons à l’usage de la séquence SVQ ‘tu fais quoi’ dans le corpus numérique Google-Books-Ngram-Viewer, nous verrons qu’il augmente de façon exponentielle à partir des années 1940-1960 pour prendre de l’élan dans les années 1980 (Graph. 1). Assez curieusement, les données de Farmer (op. cit.) et Dekhissi (op. cit.) suggèrent également que l’usage de SVQ se répand massivement dans les années 1980.
Dès lors, on pourrait faire l’hypothèse suivante : à mesure que l’emploi de SVQ devient de plus en plus important au cours du 20e siècle (Farmer, Reference Farmer2015 : 480), il commence à évincer d’autres options, principalement dans ces contextes linguistiques qui se sont avérés initialement propices à sa propagation. Mais cette hypothèse, impliquant une variation micro-diachronique, devrait être testée sur des données plus larges (cf. Baunaz et Bonan, Reference Baunaz and Bonan2023).
Acknowledgements
Ce travail a été soutenu financièrement par le programme académique de l’Université RUDN “Strategic Academic Leadership Program”. Nous tenons à remercier Laurie Dekhissi et les relecteurs anonymes pour leurs remarques et suggestions d’amélioration lors de la relecture d’une version précédente de ce manuscrit. Nous restons bien évidemment responsables des propos tenus ici.
Competing interests
The authors declare none