Sfondo
Il tempo dell’esecuzione musicale può variare all’interno di un singolo brano musicale: i musicisti possono cambiare volontariamente il tempo come espressione musicale (“deviazione artistica”) (
Drake, 1968 ;
Gabrielsson, 1974 ;
Povel, 1977 ;
Seashore, 1938 ). D’altra parte, il tempo devia anche contro l’intenzione dei musicisti: il tempo è spesso accelerato anche se i musicisti vogliono mantenere il tempo, specialmente per i musicisti non formati.
Tale accelerazione del tempo (chiamata “rushing”) è stata a lungo sottolineata nel campo della pedagogia musicale (
Allingham & Wöllner, 2022 ;
Killian, 1985 ;
Kuhn, 1977 ;
Kuhn & Gates, 1975 ;
Mito & Murao, 2000 ;
Okano et al., 2017 ). Ad esempio,
Mito e Murao (2000) hanno studiato questo fenomeno in un’esecuzione pianistica. Hanno fatto suonare a 16 pianisti bambini (età: 9-11 anni) un breve brano (“Long Long Ago” di Bayly) a tre tempi e hanno scoperto che la lunghezza media della battuta diminuiva monotonicamente (vale a dire, il tempo era accelerato) durante l’esecuzione. In particolare, nella condizione a 70 bpm (battiti al minuto), la lunghezza media della battuta nella 15a battuta ha raggiunto l’85% della durata originale, sebbene il tempo sia stato solo leggermente accelerato nella condizione a 130 bpm.
Le caratteristiche della deviazione del tempo sono state studiate nell’esperimento di laboratorio utilizzando un compito di tapping con le dita (
Collyer et al., 1992 ,
1994 ;
Repp, 2005a ,
2005b ;
Repp & Su, 2013 ;
Stevens, 1886 ). Nella maggior parte di questi studi, ai partecipanti è stato chiesto di premere un interruttore a chiave in sincronia con un metronomo per un po’ e di continuare a premere il tasto mantenendo il tempo designato dopo che il metronomo si era fermato (paradigma sincronizzazione-continuazione; vedere
Figura 1(a) ). Ad esempio, Collyer e i suoi colleghi (
Collyer et al., 1992 ) hanno esaminato la capacità di mantenere il tempo in 27 condizioni di tempo (intervallo di tapping 175–825 ms; 73–343 bpm) e hanno riferito che c’erano regioni in cui il tempo era incline ad essere accelerato e quelle in cui il tempo era incline a essere rallentato. Nello specifico, il tapping tendeva ad essere accelerato se l’intervallo inter-tap (ITI) era compreso tra 250 e 413 ms (145-240 bpm), ma a essere rallentato nell’intervallo tra 513 e 748 ms (80-117 bpm). In uno studio successivo (
Collyer et al., 1994 ), hanno replicato il risultato e hanno anche dimostrato che il tempo di tapping preferito era distribuito tra 272 ms e 450 ms. Sulla base di questi risultati, hanno sostenuto l’esistenza di un meccanismo discreto nel processo di generazione dell’intervallo nel cervello umano (“firma dell’oscillatore”).
Pertanto, il tempo del tapping a lungo termine tende ad avvicinarsi al tempo preferito anche quando il tempo originale è determinato esternamente. Il tempo preferito è strettamente correlato al tempo motorio spontaneo (SMT), che è determinato dalla velocità di tapping più comoda e naturale (
Drake & Palmer, 2000 ;
Fraisse, 1982 ) e dalla velocità di produzione spontanea (SPR) dell’esecuzione musicale (
Pfordresher et al., 2021 ;
Zamm et al., 2018 ). Il tempo del tapping continuato si è spostato sul proprio SMT (
McAuley et al., 2006 ) e il tempo dei pianisti si è spostato durante le prove ad altre velocità, mostrando una deviazione verso il loro SPR (
Zamm et al., 2018 ).
Fraisse (1982) ha scritto che il tipico SMT era di 600 ms (100 bpm), ma c’era una notevole variazione individuale che andava da 200 ms a 1400 ms. Inoltre, studi recenti hanno dimostrato che la SMT dipende da vari parametri individuali, come l’età (
McAuley et al., 2006 ), l’ora del giorno (
Hammerschmidt et al., 2021 ;
Moussay et al., 2002 ), l’esperienza musicale (
Drake et al., 2000 ;
Hammerschmidt et al., 2021 ) e le proprietà fisiche delle parti del corpo (
Peckel et al., 2014 ) (ma vedere un risultato negativo in
Rose et al., 2021 ). D’altra parte, la variazione intra-individuale nella SMT è piuttosto piccola; la SMT cambia di circa il 3-5% all’interno di una prova sperimentale (
Fraisse, 1982 ).
Sebbene il meccanismo neurale di questa deviazione del tempo non sia ancora chiaro, diversi ricercatori ne hanno proposto modelli teorici, il cui presupposto di base è che nel cervello esista un orologio interno e il suo periodo fluttui in modo stocastico con una lenta deriva (
Collier & Ogden, 2004 ;
Ogden & Collier, 2002 ). Convenzionalmente, si è postulato che la fonte della variazione del tempo siano le fluttuazioni dell’orologio centrale e/o quelle della produzione di comandi motori innescati dall’orologio centrale (
Wing & Kristofferson, 1973a ,
1973b ). Tuttavia, questi modelli non possono spiegare l’accelerazione di tendenza osservata nell’esecuzione musicale, ed è stato proposto un diverso modello matematico che ha introdotto una proprietà di tendenza esplicita all’orologio centrale (
Ogden & Collier, 2002 ). La maggior parte di questi modelli si basa sulla visione del timer a intervalli, in cui gli impulsi periodici generati da un pacemaker sono la base del processo di temporizzazione, ma è stato proposto un altro modello basato sulla visione dell’entrainment che presuppone l’esistenza di un oscillatore autosufficiente o di un insieme di tali oscillatori (
McAuley & Jones, 2003 ). Il primo modello realizza varie funzioni correlate al tempo contando e manipolando il numero di impulsi periodici mentre il secondo modello funziona regolando il ciclo e la fase dell’oscillatore.
McAuley e Jones (2003) hanno proposto un quadro teorico per spiegare i risultati empirici che fanno riferimento a questi modelli. Inoltre, la teoria dell’attenzione dinamica (
Jones, 1976 ,
1987 ), che si basava sulla visione dell’entrainment, spiegava il processo cognitivo per l’elaborazione temporale tramite il meccanismo di spostamento dell’attenzione focale tra diversi livelli di periodo e
Drake et al. (2000) hanno applicato questa teoria per spiegare l’effetto dell’età sulla SMT. In sintesi, è stato ampiamente accettato che l’orologio centrale sia la base di SMT/SPR e che sia coinvolta anche l’interazione tra l’orologio centrale e le dinamiche fisiche (
Loehr & Palmer, 2007 ;
Peckel et al., 2014 ). Uno studio recente ha dimostrato che un modello di rete con plasticità hebbiana può spiegare il processo in cui il tempo dell’esecuzione musicale si sposta verso l’SMT del musicista (
Roman et al., 2023 ). Inoltre, sono stati proposti vari modelli computazionali basati sull’inferenza bayesiana (ad esempio,
Cannon, 2021 ), sulla codifica predittiva (ad esempio,
Vuust & Witek, 2014 ) e sulla risonanza neurale (ad esempio,
Kim & Large, 2015 ) per spiegare il ritmo umano e la percezione temporale (vedere
Large et al., 2023 per una revisione).
Pertanto, le caratteristiche di deviazione del tempo del tapping sono state esaminate sia da punti di vista sperimentali che teorici. La maggior parte di questi studi ha affrontato un compito di tapping con un intervallo fisso, fatta eccezione per alcuni studi (
Drake, 1968 ;
Kuhn, 1977 ). È certo che l’azione motoria periodica (vale a dire, a intervalli regolari) è una delle attività fondamentali dell’uomo, come camminare e succhiare i neonati (
Fraisse, 1982 ). Tuttavia, i musicisti difficilmente producono suoni a intervalli e intensità fissi; di solito producono suoni con ritmi, accenti e altre articolazioni (
Boltz, 1998 ;
Krampe et al., 2000 ) anche se il frame temporale (o struttura metrica) viene mantenuto, e questa disomogeneità nelle azioni motorie può essere un fattore nella deviazione del tempo a lungo termine.
Ci sono alcune scoperte sulla relazione tra tempo e articolazione. I musicisti spesso allungano spontaneamente il suono intenso presumibilmente a causa dell’equivalenza funzionale/percettiva tra la durata e la forza (
Fraisse, 1982 ). Inoltre, un intervallo di tapping che precede l’accento è stato accorciato ma allungato immediatamente dopo l’accento, indipendentemente dal fatto che i toni del metronomo target fossero presenti o assenti (
Billon et al., 1996 ;
Billon & Semjen, 1995 ;
Keele et al., 1987 ;
Semjen & Garcia-Colera, 1986 ). È stato anche sostenuto che l’orologio interno non innescava l’inizio motorio ma piuttosto forniva il punto temporale target in cui il movimento delle dita portava il suo obiettivo comportamentale (modello di programmazione dell’endpoint; vedere anche
Shaffer (1982) ) e che le distorsioni temporali probabilmente riflettevano sia componenti centrali (vale a dire, orologio interno) che periferiche (vale a dire, esecuzione motoria) (
Billon et al., 1996 ). Ciò suggerisce la possibilità che il processo sensomotorio per generare azioni motorie non uniformi possa facilitare la deriva dell’orologio interno, con conseguente deviazione del ritmo.
Inoltre, non dovremmo dimenticare la possibilità che i fattori percettivi uditivi possano essere correlati alla deviazione del tempo. In genere, c’è correlazione tra tempo, volume e tono nell’esecuzione musicale (
Eitan & Granot, 2006 ;
Eitan & Timmers, 2010 ;
Friberg et al., 2006 ;
Granot & Eitan, 2011 ), e la percezione del tempo è influenzata dalle articolazioni musicali. Ad esempio, il giudizio del tempo era influenzato dall’articolazione (staccato e legato) (
Geringer et al., 2006 ,
2007 ). Il giudizio degli intervalli temporali era disturbato dagli accenti (
Tekman, 1997 ), e il tempo richiesto per percepire il cambiamento di tempo era influenzato dal pattern ritmico e dalla posizione del battito (
Wang, 1984 ). È stato anche dimostrato che la sensibilità al tempo era compromessa con ritmi irregolari rispetto al ritmo regolare (
Drake & Botte, 1993 ). Quando gli intervalli di tono venivano accorciati della metà (ad esempio, passando da quattro quarti a otto ottavi), le persone percepivano come se il tempo fosse rallentato (“illusione di tempo diviso”) (
Repp, 2008 ;
Repp & Bruttomesso, 2009 ;
Repp & Ladiges, 2012 ). Pertanto, se si cercava di mantenere il tempo a tali cambiamenti, le persone acceleravano il tapping in modo da mantenere il tempo percettivo. Questo effetto di cambiamento di tempo transitorio è stato effettivamente osservato sia in un esperimento di laboratorio (
Repp, 2008 ) sia nell’esecuzione effettiva del pianoforte (
Repp & Bruttomesso, 2009 ). Inoltre, anche il cambiamento di tono (altezza del tono) influisce sulla percezione del tempo. I toni con un tono più alto venivano valutati più velocemente di quelli con un tono più basso e le sequenze di toni ascendenti venivano valutate più velocemente e come più veloci delle sequenze discendenti (
Collier & Hubbard, 1998 ). Le sequenze di toni contenenti un numero maggiore di cambiamenti nella direzione del tono e una maggiore entità di salti di tono sono state giudicate svolgersi più lentamente (
Boltz, 1998 ).
Boltz (2011) ha anche mostrato che il tempo è stato giudicato più veloce quando si visualizzava un tono più alto e/o un timbro più luminoso e quando la melodia aumentava di tono e/o intensità nel tempo. Allo stesso modo, la percezione di una durata è stata alterata da variazioni di tono piccole quanto un quarto di semitono (
Pfeuty & Peretz, 2010 ) e diversi livelli di tono dei toni flanker hanno influenzato la durata percepita (
Lake et al., 2014 ). Come accennato in precedenza, il tempo del tapping è stato regolato per mantenere il tempo percepito sotto una tale modulazione della percezione del tempo. In realtà, il contorno del tono ha modulato il tempo del tapping delle dita (
Ammirante et al., 2011). In un compito di air-tapping, la frequenza del tapping (vale a dire, il tempo) è stata influenzata dai pattern di accento dei toni di feedback (
Bouvet et al., 2020 ). Pertanto, i fattori uditivi influenzano sicuramente il tempo del tapping. D’altro canto, i risultati di cui sopra hanno dimostrato principalmente effetti transitori o locali e non hanno mostrato i loro effetti sul cambiamento di tempo a lungo termine.
Per chiarire se le azioni motorie irregolari richieste per l’articolazione musicale siano un fattore significativo nella deviazione involontaria del tempo, qui esaminiamo l’effetto dei pattern ritmici e di accento sulla proprietà di mantenimento del tempo a lungo termine di un compito di tapping con le dita. Chiediamo anche l’effetto degli accenti, delle dinamiche (ad esempio, crescendo e diminuendo) e del pitch contour (ad esempio, scala ascendente e scala discendente) dei toni di risposta in cui i partecipanti non devono riprodurre questi pattern ma solo i toni di risposta sono stati modulati, per rivelare i fattori percettivi nella deviazione del tempo a lungo termine. La deviazione involontaria del tempo è osservata principalmente con musicisti non formati, mentre i musicisti esperti possono controllare liberamente il tempo come mezzo di espressione musicale. Pertanto, abbiamo condotto esperimenti con partecipanti che non avevano ricevuto un’istruzione musicale professionale.
Metodi
Partecipanti
Abbiamo condotto tre esperimenti e 28 (età: 19–60, 18 maschi e 10 femmine), 18 (età: 19–60, 10 maschi e 8 femmine) e 15 (età: 19–60, 9 maschi e 6 femmine) studenti laureati/laureandi e membri dello staff dell’Università di Elettrocomunicazioni hanno preso parte rispettivamente agli esperimenti 1, 2 e 3. Sono stati pagati 1.200 yen giapponesi per ogni sessione sperimentale.
Apparecchiatura
L’esperimento è stato condotto in una stanza di laboratorio silenziosa. I partecipanti erano seduti a una scrivania su cui erano posizionati una barra di risposta e due altoparlanti (“altoparlante target” e “altoparlante di risposta”) (
Figura 1(b) ). Gli altoparlanti erano posizionati simmetricamente a 80 cm di fronte al partecipante. Si noti che la differenza temporale interaurale è trascurabile in questa impostazione. Il sistema sperimentale è stato originariamente progettato e costruito con microcontrollori basati su Arduino (Arduino MKR Zero) per ridurre al minimo i ritardi di acquisizione dati ed elaborazione del segnale. Abbiamo adottato una barra sensore di forza per monitorare la forza imposta dal tocco delle dita. Questo sensore aveva una forma a barra con dimensioni di 12 × 12 × 80 mm ed era dotato di un estensimetro che misurava la forza applicata alla parte anteriore dell’asta. Si noti che la barra di risposta era rigida e non si muoveva verso il basso quando veniva toccata: monitorava il modello di forza temporale, a differenza di un tasto di risposta standard che monitora il movimento della pressione del tasto. L’output del sensore è stato amplificato e raccolto dal microcontrollore con una frequenza di campionamento di 320 Hz (ovvero, l’intervallo di campionamento era di 3,125 ms). Quando il segnale di forza superava una determinata soglia, il sistema lo trattava come un evento di tapping e generava un tono (onda sinusoidale di tono G5 (783 Hz) nella maggior parte delle condizioni; durata 50 ms, rastremata) dall’altoparlante di risposta. Nello specifico, il microcontrollore generava un segnale per il suono all’altoparlante tramite un amplificatore digitale a una frequenza di campionamento di 8 KHz. L’ampiezza della forma d’onda del segnale era fissa nell’esperimento 1 ma era amplificata linearmente in funzione dell’ampiezza della forza negli esperimenti 2 e 3 (vedere Progettazione e procedura per i dettagli). Il ritardo dall’inizio della forza all’inizio del tono era di 13-17 ms poiché il microcontrollore valutava l’evento di tapping e l’intensità della forza utilizzando quattro campioni consecutivi. Questo ritardo è abbastanza breve da far sì che il tono di risposta fosse percepito come parte integrante del tapping (vale a dire, il tono di risposta era percepito contemporaneamente all’azione del tapping). I dati di forza grezzi e i dati di ampiezza/temporizzazione del tono sono stati trasferiti dal microcontrollore a un PC (gestito da Windows 10 Pro) tramite un’interfaccia USB. I toni target (onda sinusoidale del tono C5 (523 Hz); durata 50 ms, rastremata) sono stati generati da un altro microcontrollore e presentati dall’altoparlante target. Sebbene i livelli di pressione sonora dei toni target/risposta non siano stati misurati, lo sperimentatore ha regolato la loro intensità in modo che entrambi i toni e i loro cambiamenti di intensità potessero essere facilmente percepiti. Alcuni potrebbero sospettare che i toni target e di risposta (C5 vs. G5) siano difficili da separare a causa della loro consonanza, ma i partecipanti sono riusciti a dissociarli senza difficoltà perché i toni di risposta erano sincronizzati con le loro risposte e perché erano generati da altoparlanti diversi.
Progetto
La Figura 1(c) riassume le condizioni sperimentali in tre esperimenti. In tutti gli esperimenti, abbiamo incluso la condizione di controllo in cui ai partecipanti è stato chiesto di eseguire il tapping con le dita a intervalli regolari (non è stata data alcuna istruzione esplicita sulla forza del tapping). L’esperimento 1 si è concentrato sull’effetto del ritmo: sono state esaminate sei condizioni di ritmo. La condizione A è la condizione di controllo che richiede il tapping regolare. La condizione B è la ripetizione del set di tre tapping e una pausa, e abbiamo esaminato l’effetto di una pausa (ovvero, l’inibizione dell’azione del tapping) all’interno di un metro a 4 battute. La condizione C è la ripetizione del set di due tapping e due pause, chiedendo l’effetto di due pause consecutive. La condizione D è la ripetizione del set di due tapping e una pausa, chiedendo di nuovo l’effetto di una pausa ma all’interno di una struttura metrica a 3 battute. Le condizioni E ed F includono intervalli di mezza lunghezza e ritmo puntato e chiedono i loro effetti. Qui vanno notati due punti. In primo luogo, i partecipanti non hanno tenuto la pressa per la lunghezza della nota indicata nella
Figura 1(c) , ma hanno mosso il dito verso l’alto immediatamente dopo aver toccato la barra. In secondo luogo, le Condizioni E e F possono essere considerate la versione a doppia velocità delle condizioni B e C, rispettivamente, se ignoriamo la struttura metrica. Non sappiamo come i singoli partecipanti abbiano percepito la struttura metrica durante il compito, ma pensiamo che la maggior parte dei partecipanti li abbia trattati come diversi pattern ritmici senza notare la relazione a doppia velocità.
L’esperimento 2 si è concentrato sull’effetto dell’accento. Abbiamo preparato tre modelli di accento B, C e D (tranne per la condizione di controllo A). Nella condizione B, i partecipanti hanno eseguito tocchi accentati e non accentati, alternativamente (questo può essere considerato come l’accento del primo battito di un metro a 2 battiti (ad esempio, battito anteriore), l’accento del secondo battito (ad esempio, battito posteriore) o altri). Nella condizione C, d’altra parte, gli accenti sono stati posizionati una volta ogni quattro tocchi, il che potrebbe essere presumibilmente interpretato come l’accento del primo battito di un metro a 4 battiti (sono possibili anche altre interpretazioni). Queste condizioni sono state progettate per esaminare l’effetto di diverse strutture metriche oltre all’effetto di azioni di tapping non uniformi. Nella condizione D, due accenti e due non accenti sono stati posizionati alternativamente, il che ha chiesto l’effetto di due accenti consecutivi (questo modello può essere interpretato come “accento, accento, non accento, non accento” o “accento, non accento, non accento, accento”). I partecipanti hanno eseguito questi tapping accentati in due condizioni (“automatico” e “manuale”). Nella condizione automatica, l’intensità dei toni di risposta è stata modulata automaticamente dal rapporto predeterminato indipendentemente dalla forza effettiva del tapping. Nello specifico, il rapporto delle ampiezze della forma d’onda dei toni non accentati e accentati era 1:4, e questo era lo stesso per i toni target. Nella condizione manuale, al contrario, ai partecipanti è stato chiesto di riprodurre manualmente il modello di accento dei toni di risposta controllando autonomamente la forza del tapping: l’ampiezza della forma d’onda del tono di risposta è aumentata linearmente con la forza del tapping, come menzionato sopra.
L’esperimento 3 si è concentrato sull’effetto della dinamica e del pattern di altezza. Abbiamo preparato i pattern di crescendo e diminuendo per la dinamica e le scale ascendenti e discendenti (1 ottava) per il contorno di altezza. Alcuni potrebbero sospettare che la ripetizione di questi semplici pattern di volume/altezza sia artificiale e raramente utilizzata nella musica reale. In realtà, alcuni ricercatori hanno utilizzato sequenze di toni più sofisticate per gli esperimenti (ad esempio,
Granot & Eitan, 2011 ). Tuttavia, le abbiamo adottate perché erano semplici e ripetibili per lungo tempo e, almeno, non erano sequenze di toni spiacevoli. La dinamica e l’altezza erano fornite dal pattern predeterminato come nella condizione automatica dell’esperimento 2 (nessuna condizione manuale nell’esperimento 3). Il rapporto delle ampiezze della forma d’onda di otto toni nella condizione di crescendo era 2:3:5:7:10:13:16:20 (e l’ordine inverso nella condizione di diminuendo). Nelle condizioni di intonazione, l’intonazione dei toni di destinazione e di risposta era identica (da C5 a C6), diversa dalle altre condizioni (C5 contro G5).
Procedura
Abbiamo adottato un paradigma di sincronizzazione-continuazione come negli studi convenzionali. I partecipanti hanno eseguito il tapping con le dita in sincronia con i toni target per un po’ e hanno continuato il tapping con lo stesso tempo e lo stesso schema di ritmo/accento dopo che i battiti target erano terminati (
Figura 1(a) ). Nell’esperimento, il tempo è stato fissato a 132 bpm (l’intervallo di battitura era di 455 ms) perché è stato riportato che il tempo era quasi mantenuto nell’intervallo di 117 e 145 bpm (
Collyer et al., 1992 ) e il tempo target era all’interno dell’intervallo tipico di SMT/SPR (400–600 ms). La lunghezza della fase di sincronizzazione era di 16 battute (64 tapping nella condizione di tapping regolare; circa 29 s) e quella della fase di continuazione era di 150 s (circa 300 tapping per il tapping regolare).
Per ogni condizione, i partecipanti hanno eseguito prove di familiarizzazione dopo aver ricevuto la spiegazione sul compito. Non è stato mostrato alcuno spartito musicale (come nella
Figura 1(c) ) in modo che i partecipanti non avessero nozioni preconcette sul raggruppamento dei tocchi. Hanno ripetuto le prove di familiarizzazione finché non si sono sentiti abbastanza familiari con il compito. Quindi, hanno eseguito prove formali due volte. In genere, ci sono voluti circa 7-8 minuti per ogni condizione (inclusi familiarizzazione e prove formali). Hanno ripetuto la stessa procedura per 6, 7 e 5 condizioni negli Esperimenti 1, 2 e 3, rispettivamente. Abbiamo lasciato un po’ di tempo di riposo tra le prove successive. Tutti i partecipanti hanno eseguito il compito in tutte le condizioni in ogni esperimento. L’ordine delle condizioni sperimentali non è stato controbilanciato ma è stato lo stesso per tutti i partecipanti (secondo l’ordine mostrato nella
Figura 1 ). Ogni esperimento ha richiesto circa un’ora per essere completato.
Sebbene il requisito principale del compito fosse di mantenere il ritmo del tapping delle dita in tutti e tre gli esperimenti, alcuni punti minori erano diversi tra loro. Nell’esperimento 1, ai partecipanti è stato semplicemente chiesto di mantenere il tempo e il ritmo, e questo è stato lo stesso nelle condizioni di controllo degli esperimenti 2 e 3. Nella condizione automatica dell’esperimento 2, ai partecipanti è stato detto che avrebbero dovuto mantenere il tempo del tapping e non dovevano preoccuparsi della forza del tapping perché i toni di risposta erano automaticamente accentati dal programma sperimentale. Nella condizione manuale dell’esperimento 2, d’altro canto, è stato chiesto loro di mantenere il tempo riproducendo anche il pattern di accento regolando autonomamente la forza del tapping. Tutti i partecipanti hanno eseguito le prove nella condizione automatica prima della condizione manuale (vale a dire, non controbilanciata) in modo che l’influenza della regolazione della forza nella condizione manuale non interferisse con il tapping nella condizione automatica. Le istruzioni per l’esperimento 3 erano le stesse della condizione automatica dell’esperimento 2 poiché l’intensità e l’altezza dei toni di risposta erano determinate automaticamente.
Dopo aver completato tutti i compiti, ai partecipanti è stato consegnato un breve questionario in cui venivano richieste le loro esperienze musicali e le loro impressioni soggettive nello svolgimento dei compiti sperimentali.
Analisi dei dati
I dati di tutti i partecipanti sono stati raggruppati per l’analisi statistica, salvo diversamente indicato. L’elaborazione dei dati e l’analisi statistica sono state eseguite utilizzando il software Matlab (Mathworks, USA).
Abbiamo prima estratto gli ITI dai dati grezzi e li abbiamo segmentati in un’unità di barra per calcolare la lunghezza della barra. Abbiamo corretto manualmente la lunghezza della barra o trattato come dati mancanti quando gli eventi di tapping previsti sono stati persi. Abbiamo quindi calcolato la variazione percentuale nella lunghezza della barra per ogni barra utilizzando la seguente formula:
Successivamente, è stata eseguita un’analisi di regressione per esaminare la tendenza a lungo termine della lunghezza della barra: abbiamo stimato la pendenza e l’intercetta della linea di regressione dei dati di variazione percentuale per ogni prova, utilizzando i dati dalla 5a alla 55a battuta (dalla 5a alla 70a battuta per la condizione D nell’Esperimento 1 (vale a dire, condizione del misuratore a 3 battiti)) nella fase di continuazione. Abbiamo eseguito un’analisi statistica sulle pendenze e le intercette stimate utilizzando test non parametrici perché i dati non sembravano obbedire a una distribuzione normale, come mostrato di seguito. Quando abbiamo discusso la proprietà dei singoli partecipanti, abbiamo utilizzato i valori medi (vale a dire, pendenze e intercette) di due prove. Abbiamo calcolato la differenza nelle pendenze tra la condizione di interesse e la condizione di controllo (vale a dire, tapping regolare) per ogni partecipante quando abbiamo esaminato l’effetto della condizione individuale (vale a dire, articolazione).
Risultati
Esperimento 1
Solo 15 dei 28 partecipanti hanno portato a termine il compito in tutte le condizioni. I restanti partecipanti non sono riusciti a mantenere il ritmo corretto nelle condizioni D, E e/o F (specialmente nella condizione D). Discuteremo questo punto nella sezione Discussione. Inoltre, uno dei 15 partecipanti che ha portato a termine il compito ha mostrato una variabilità piuttosto ampia (la deviazione standard (DS) era di 65,5 ms) della differenza tra ITI successivi nella condizione di controllo, rispetto agli altri partecipanti (le DS erano di 24,7-41,8 ms). Pertanto, abbiamo scartato i dati di questi partecipanti e adottato i dati di 14 partecipanti (vale a dire, 28 prove) per ulteriori analisi.
La Figura 2 mostra due esempi (condizioni A e C) di variazione temporale nella lunghezza della barra. L’asse verticale mostra la variazione percentuale nella lunghezza della barra rispetto alla lunghezza della barra originale, dove una barra è definita come nella
Figura 1(c) . In ogni pannello, sottili curve grigie mostrano i risultati delle singole prove e una spessa curva rossa mostra la media mobile (su 7 barre) della loro media. Due sottili curve rosse indicano l’intervallo di errore standard.
In questi grafici si possono trovare due punti caratteristici. In primo luogo, la lunghezza media della barra ha mostrato diverse tendenze a lungo termine tra due condizioni, sebbene la lunghezza della barra delle singole prove abbia fluttuato ogni barra. In particolare, la lunghezza media della barra è diminuita uniformemente (vale a dire, tendenza in accelerazione) durante la fase di continuazione nella condizione A, ma è rimasta quasi piatta nella condizione C. In secondo luogo, la lunghezza media della barra è aumentata transitoriamente subito dopo il passaggio dalla fase di sincronizzazione alla fase di continuazione nella condizione C, ma non nella condizione A.
Per quantificare l’entità della deviazione del tempo nella fase di continuazione, abbiamo eseguito un’analisi di regressione sul cambiamento temporale della lunghezza relativa della barra. Concretamente, abbiamo stimato la pendenza e l’intercetta di una linea di regressione per i dati di variazione percentuale (
Figura 2 ) per ogni prova, dove la pendenza rappresenta la tendenza a lungo termine e l’intercetta rappresenta la variazione transitoria subito dopo il cambio di fase.
La Figura 3 riassume le pendenze e le intercettazioni stimate in sei condizioni. Qui, le barre rappresentano i valori mediani inter-prova mentre i punti rappresentano i valori nelle singole prove. Si noti che la pendenza stimata nella condizione D è stata moltiplicata per 4/3 (perché c’erano solo tre tocchi in una barra in questa condizione, ma quattro tocchi nelle altre condizioni) in modo che le pendenze stimate possano essere confrontate tra le condizioni. Ci sono tre punti da notare. In primo luogo, le pendenze delle singole prove erano distribuite su un’ampia gamma, il che significa che c’erano differenze individuali sostanziali: nessuna condizione di ritmo apparentemente aveva un effetto di accelerazione/decelerazione coerente comune a tutti i partecipanti. In secondo luogo, tuttavia, le pendenze mediane erano apparentemente negative nelle condizioni A, D ed E, indicando che, come insieme, il tempo di tapping tendeva a essere più veloce in queste condizioni. In terzo luogo, le intercette mediane erano positive nelle condizioni B, C ed F, ma non nelle altre condizioni. Ciò significa che l’effetto del cambio di fase (o rimozione del tono target) è stato osservato in condizioni limitate.
Abbiamo eseguito test statistici sulle osservazioni di cui sopra. Abbiamo adottato test non parametrici perché i dati apparentemente non obbedivano a distribuzioni normali come nella
Figura 3. Un test Wilcoxon dei ranghi con segno ha mostrato che la pendenza era significativamente diversa da zero nelle condizioni A (
�<0,05,lo=−1.9811), D (
�<0,05,lo=−2.5276) ed E (
�<0,05,lo=−2.2999)Un altro test dei ranghi con segno ha mostrato che l’intercetta era significativa nelle condizioni B (
�<0,05,lo=2.0267) e F (
�<0,01,lo=2.9603), e prossimo a significativo nella condizione C (
�=0,0877,lo=1.7079). Pertanto i test statistici hanno in parte supportato la visione sopra menzionata.
Abbiamo evidenziato sostanziali variabilità inter-prova nelle
Figure 2 e
3. Come menzionato nella sezione Background, la capacità di mantenere il tempo varia da persona a persona a causa di vari fattori, tra cui l’esperienza musicale. Dato che i musicisti esperti sono plausibilmente meno influenzati dai pattern ritmici, l’effetto del ritmo potrebbe essere più pronunciato e coerente per i partecipanti che hanno mostrato una maggiore varianza tra diverse condizioni ritmiche. Per esaminare ulteriormente questo punto, e senza una misura dell’esperienza musicale dei partecipanti, abbiamo diviso i partecipanti in due gruppi, “stabili” e “variabili”, in base alla deviazione standard delle pendenze in diverse prove.
La Figura 4(a) mostra le pendenze per i singoli partecipanti, dove l’asse orizzontale indica i partecipanti in ordine di aumento della deviazione standard nelle prove. Ogni punto indica la pendenza di una prova (si noti che ci sono due punti per una condizione ritmica perché sono state eseguite due prove per una condizione). Abbiamo classificato metà dei partecipanti con SD più piccole nel gruppo stabile (SD: 0,032-0,070%/bar) e i partecipanti rimanenti nel gruppo variabile (SD: 0,070-0,131%/bar). Si noti che i partecipanti stabili non hanno necessariamente mantenuto il ritmo: le pendenze stimate erano distribuite simmetricamente attorno allo zero per i partecipanti n. 1 e n. 2, ma quelle dei partecipanti n. 4 e n. 8 erano distribuite principalmente oltre lo zero, il che significa che tendevano generalmente a decelerare il ritmo. Allo stesso modo, anche altri partecipanti hanno mostrato le proprie tendenze di accelerazione/decelerazione. Pertanto, la capacità di mantenere il ritmo a lungo termine dipendeva dai singoli partecipanti.
La nostra domanda principale è l’effetto dei pattern ritmici sulla deviazione del tempo a lungo termine, e quindi dovremmo esaminare la deviazione del tempo relativa alla condizione di controllo. Abbiamo calcolato la pendenza relativa nelle condizioni B–F, ovvero la differenza tra le pendenze nelle condizioni B–F e quella nella condizione di controllo A.
La Figura 4(b) riassume le pendenze relative separatamente per i gruppi stabili e variabili, dove le barre rappresentano le pendenze mediane tra i partecipanti e i punti rappresentano le pendenze dei singoli partecipanti. È difficile indicare delle caratteristiche chiare a causa di un numero esiguo di dati e della loro grande variabilità, ma sembra esserci poca differenza tra le distribuzioni dei dati dei due gruppi, fatta eccezione per le loro variabilità. Se non altro, la pendenza relativa era generalmente vicina allo zero per il gruppo stabile mentre la pendenza mediana era positiva nelle condizioni B e C per il gruppo variabile.
Abbiamo testato queste osservazioni utilizzando un test dei ranghi con segno. Per il gruppo variabile, la pendenza relativa era solo vicina alla significatività nella condizione C (
p = 0,0781). Per il gruppo stabile, d’altro canto, la pendenza relativa era significativa nelle condizioni B (
p < 0,05) e D (
p < 0,05). Pertanto, contrariamente alle nostre aspettative, non siamo riusciti a trovare un effetto più significativo dei pattern ritmici nel gruppo variabile. La bassa significatività statistica del gruppo variabile può essere in parte dovuta alla sua elevata variabilità tra i partecipanti, ma è anche vero che non si può trovare una chiara differenza tra le diverse condizioni: presumibilmente, l’ampia variabilità inter-prova del gruppo variabile è semplicemente dovuta a differenze individuali piuttosto che agli effetti di ritmi diversi. Pertanto, non tratteremo più i dati separatamente per i due gruppi, ma tratteremo tutti i dati insieme. Un test dei ranghi con segno per i dati aggregati ha mostrato che la pendenza relativa era significativa nella condizione B (
p < 0,05) e significativa al limite nella condizione C (
p = 0,0580) (si noti che gli asterischi nella
Figura 4(b) indicano la significatività statistica per i dati aggregati). Ciò significa che una o due pause all’interno di un metro a 4 battiti hanno avuto un effetto significativo nel causare un’accelerazione a lungo termine, ma gli intervalli di mezza lunghezza e i ritmi puntati hanno avuto scarso effetto.
Esperimento 2
Tre dei 18 partecipanti non hanno eseguito correttamente il compito: due non hanno seguito fedelmente le istruzioni del pattern di accento e uno tendeva a continuare a toccare (o premere) la barra di risposta dopo averla toccata. Un altro partecipante ha fornito una grande varianza di differenza di ITI successivi (SD era 51,4 ms). Pertanto, abbiamo scartato i loro dati e utilizzato i dati di 14 partecipanti per ulteriori analisi.
La Figura 5(a) riassume le pendenze e le intercette stimate da un’analisi di regressione della variazione percentuale della lunghezza della barra come nella
Figura 3 : le barre rappresentano le mediane inter-prova e i punti rappresentano i valori individuali. L’asse orizzontale rappresenta le condizioni dell’esperimento, dove “A” attraverso “D” indicano i modelli di accento e i suffissi “a” e “m” indicano rispettivamente le condizioni automatiche e manuali. La pendenza mediana era negativa in tutte le condizioni, sebbene fosse vicina allo zero nella condizione Dm, il che significa che il tempo era generalmente accelerato in questo esperimento. L’intercetta era negativa in tutte le condizioni, tranne che per la condizione di controllo A, il che indica che il passaggio dalla fase di sincronizzazione alla fase di continuazione aveva un effetto accelerante. Di nuovo, abbiamo osservato grandi differenze individuali (
Figura 5(b) ), ma la deviazione standard inter-prova era generalmente inferiore rispetto all’Esperimento 1 (l’intervallo della deviazione standard era 0,024-0,082%/barra mentre era 0,032-0,131%/barra nell’Esperimento 1).
La Figura 5(c) mostra le pendenze relative nella condizione B–D, dove le barre rappresentano le pendenze mediane tra i partecipanti e i punti rappresentano le pendenze degli individui, come nella
Figura 4(b) . Qui, abbiamo trattato tutti i partecipanti insieme. La pendenza relativa era positiva nella condizione Dm ma era quasi zero nelle altre condizioni, il che significa che il tapping accentato era rallentato quando i partecipanti ripetevano il set di due accenti e due non accenti. Inoltre, la distribuzione dei punti sembrava distorta verso il positivo nelle condizioni Da, suggerendo la possibilità che questo schema di accento avesse un effetto di rallentamento indipendentemente dalle condizioni automatiche o manuali.
Queste osservazioni sono state testate dai test Wilcoxon dei ranghi con segno. La pendenza era significativamente diversa da zero in tutte le condizioni, eccetto per la condizione Dm (A:�<0,001,lo=−3.5523,:Ba:�<0,001,lo=−3.5979, Circa:�<0,001,lo=−3.4385, Da:�<0,01,lo=−2.7098, Bm:�<0,01,lo=−3.0058, Cm:�<0,001,lo=−4.4177). L’intercetta era significativamente diversa da zero nelle condizioni Da (�<0,01, lo=−3.5523), Bm (�<0,001,lo=−3.5979), e Cm (�<0,001,lo=−3.4385), e vicino a significativo in condizione Ba (�=0,0619,lo=−2.7098). D’altro canto, la pendenza relativa era significativamente diversa da zero solo nella condizione Dm ( p < 0,05). Infine, abbiamo provato a eseguire un’ANOVA a 2 vie (condizione di accento (B–D) × condizione automatica/manuale) per testare gli effetti di queste condizioni e la loro interazione sulla pendenza relativa, sebbene potrebbe essere inappropriato adottare un test parametrico in questo caso. L’effetto principale del pattern di accento era vicino alla significatività (�=0,0679,�(2,78)=2.79)ma l’effetto principale della condizione manuale/automatica e l’interazione non erano significativi (�=0,1938,�(1,78)=1.72;�=0,7339, �(2,78)=0,31), che apparentemente concorda con l’osservazione di cui sopra.
Alcuni sospettano la possibilità che i partecipanti abbiano modificato autonomamente la forza del tocco in base ai toni di risposta, anche se non hanno provato consapevolmente a riprodurre gli accenti. Per verificarlo, abbiamo esaminato la forza del tocco durante la fase di continuazione.
La Figura 6(a) raffigura il rapporto di forza mediano di ogni tocco rispetto al primo tocco all’interno di una barra, dove i punti neri rappresentano i rapporti mediani dei singoli partecipanti e i cerchi rossi rappresentano le loro mediane (i triangoli blu indicano le posizioni degli accenti). Si noti che il rapporto è sempre uno per il primo tocco. Questa figura mostra che tutti i partecipanti hanno riprodotto fedelmente il modello di accento nella condizione manuale (si noti che il rapporto di ampiezza dei toni non accentati e accentati era 1:4 come descritto nella sezione Metodo), ma mostra anche che la maggior parte dei partecipanti ha modificato la forza del tocco in base ai modelli di accento forniti nella condizione automatica. I test di Kruskal-Wallis hanno rilevato significative differenze inter-tocco in tutte le condizioni automatiche: Ba (
�<0,001,�(3,108)=64.38), Ca (
�<0,001,�(3,108)=64.27) e Da (
�<0,001, �(3,108)=64.27). La modulazione della forza riscontrata nella condizione automatica implica che qualsiasi effetto osservato nella condizione automatica non debba essere considerato come un effetto puramente sensoriale/percettivo.
Abbiamo anche esaminato gli ITI relativi all’interno di una barra per osservare come i pattern di accento modulassero gli ITI individuali. Nella
Figura 7(a) , l’asse orizzontale mostra la posizione del tocco all’interno di una barra dove i triangoli indicano le posizioni dell’accento e l’asse verticale mostra i rapporti mediani degli ITI dei singoli tocchi rispetto alla lunghezza della barra. Si noti che la posizione 1 sull’asse orizzontale indica l’ITI tra le posizioni 1 e 2 e così via. Poiché gli ITI target sono identici, i rapporti dovrebbero essere idealmente 0,25 (=1/4) per tutte le posizioni. I piccoli punti neri indicano le mediane (per tutte le barre nella fase di continuazione) dei singoli partecipanti e i cerchi rossi indicano le loro mediane. I rapporti sono stati modulati dalle posizioni del tocco nelle condizioni C e D sia in condizioni automatiche che manuali. L’ITI nella posizione dell’accento è stato allungato nella condizione C, ma non nella condizione D: l’ITI è stato il più lungo nella terza posizione nella condizione Da, ma nella seconda nella condizione Dm. È interessante notare che nella condizione B non è stata osservata alcuna modulazione degli accenti. Pertanto, i modelli di accento hanno interrotto l’uniformità degli ITI, ma l’accento in sé non ha necessariamente prolungato l’ITI.
La non uniformità dei rapporti ITI è stata supportata da test statistici. I risultati del test di Kruskal–Wallis hanno mostrato che il rapporto degli ITI era significativamente diverso tra le posizioni in condizioni Ca (
�<0,001,�(3,108)=35.06), Da (
�<0,01,�(3,108)=13.9), Cm (
�<0,001, �(3,108) =28.38) e Dm (
�<0,001,�(3,108)= 29.29). Confrontando
le Figure 5(a) con
7(a) , d’altro canto, non possiamo vedere alcuna chiara relazione tra la non uniformità degli ITI locali e l’esistenza di un trend del tempo a lungo termine: una significativa modulazione dell’ITI locale non ha causato una variazione significativa del tempo a lungo termine.
In sintesi, abbiamo scoperto che uno specifico schema di accento determinava una significativa deviazione del tempo a lungo termine, sebbene non sembri esserci alcuna correlazione tra la deviazione del tempo a lungo termine e le fluttuazioni locali di ITI/forza.
Esperimento 3
Complessivamente 14 partecipanti su 15 hanno completato con successo il compito e abbiamo utilizzato i loro dati per ulteriori analisi.
La Figura 8(a) riassume le pendenze e le intercette stimate come nella
Figura 5(a) : le barre rappresentano le mediane inter-prova e i punti rappresentano i valori individuali. La pendenza mediana ha assunto valori negativi in tutte le condizioni, il che significa che il tempo è stato generalmente accelerato. Per quanto riguarda l’intercetta, i valori mediani hanno assunto valori negativi nelle condizioni crescendo e ascendente mentre erano quasi zero nelle altre condizioni. Sono state osservate grandi differenze individuali e ogni partecipante sembrava avere le proprie tendenze di accelerazione/decelerazione come negli Esperimenti 1 e 2 (
Figura 8(b) ). Le SD inter-prova erano generalmente piccole (inferiori allo 0,05%/barra) eccetto per i due partecipanti più variabili (0,116 e 0,081%/barra): per esaminare la differenza rispetto alla condizione di controllo,
la Figura 8(c) mostra le pendenze relative in quattro condizioni, dove le barre rappresentano la mediana tra i partecipanti e i punti rappresentano i dati individuali. Le pendenze relative mediane erano leggermente negative in tutte le condizioni, indicando una debole tendenza all’accelerazione in tutte le condizioni dinamiche/tono.
I test di Wilcoxon con rango firmato hanno mostrato che la pendenza era significativamente diversa da zero nelle condizioni Cres (�<0,01,lo=−3.1198), Scuro (�<0,05,lo=−2.2089), Crescente (�<0,01,lo=−2.6643), e Desc (�<0,001, lo=−3.6891)), e vicino alla significatività nella condizione di controllo (�=0,0619,lo=−1.8673). L’intercetta è stata significativa nelle condizioni Cres (�<0,05,lo=−2.0040) e Ascendente (�<0,001,lo=−3.8940). D’altra parte, la pendenza relativa era significativamente diversa da zero solo nella condizione Cres (�<0,05).
Abbiamo analizzato la forza di maschiatura relativa (
Figura 6(b) ) e i rapporti ITI (
Figura 7(b) ) come nell’Esperimento 2. Abbiamo trovato cambiamenti significativi nella forza di maschiatura in tutte le condizioni (tranne per la condizione di controllo): Cres (
�<0,001,�(7,216)=28.11), Scuro (
�<0,001,�(7,216)=89,47), Crescente (
�<0,01, �(7,216)=23.47), e Desc (
�<0,01,�(7,216) =24.16) (test di Kruskal-Wallis) e ha rilevato effetti significativi della posizione del rubinetto sul rapporto ITI in tutte le condizioni Cres (
�<0,001,�(7,216)=48.62), Scuro (
�<0,001, �(7,216)=29.18), Crescente (
�<0,001,�(7,216)=29.33), e Desc (
�<0,001,�(7,216)=50.13) (test di Kruskal–Wallis). In particolare, la forza del tapping tendeva ad aumentare per la sequenza crescendo e a diminuire per la sequenza diminuendo, il che implica che i partecipanti modulavano la forza del tapping in base all’intensità dei toni di risposta. Per la sequenza ascendente e discendente, non è stata osservata alcuna tendenza del genere.
Infine, abbiamo eseguito un’analisi di regressione all’interno di una sequenza di toni per esaminare la tendenza locale di accelerazione/decelerazione. Abbiamo stimato una pendenza dai rapporti ITI mediani di otto tocchi all’interno di una sequenza per ogni prova e calcolato la loro mediana inter-prova. Le pendenze mediane erano −1,9 × 10
−4 , 7,8 × 10
−4 , −3,2 × 10
−4 e 8,2 × 10
−4 (questi valori indicano di quanto i rapporti ITI (non ITI grezzi) sono aumentati in un ciclo) rispettivamente nelle condizioni crescendo, diminuendo, ascendente e discendente e non significativamente diverse da zero (test dei ranghi con segno). Tuttavia, la differenza di pendenza non era significativa tra le condizioni crescendo e diminuendo (
p = 0,2348,
z = −1,1881) ma al limite della significatività tra le condizioni ascendenti e discendenti (
p = 0,0521,
z = −1,9419) (test della somma dei ranghi), suggerendo che il tempo era localmente più accelerato per la sequenza di toni ascendenti rispetto a quella discendenti. Tuttavia, la tendenza del tempo a lungo termine non ha mostrato alcuna differenza tra queste condizioni (
Figura 8(c) ).
Discussione
Il presente studio ha chiesto se i pattern di ritmo e accento influenzassero la capacità di mantenere il tempo in un compito di tapping con le dita, con l’obiettivo di esaminare se il processo sensomotorio accompagnato dall’articolazione musicale causasse la variazione di tempo a lungo termine. Il risultato ha mostrato che sia i pattern di ritmo che quelli di accento potevano influenzare la capacità di mantenere il tempo a lungo termine, ma i loro effetti erano piuttosto piccoli. Le deviazioni di tempo erano entro diverse percentuali in 150 s per la maggior parte delle prove, il che rientra nell’intervallo della normale variazione intra-individuale di SMT (vale a dire, circa il 3-5%) (
Fraisse, 1982 ). Tuttavia, abbiamo osservato una significativa accelerazione/decelerazione a lungo termine in alcuni tapping ritmici e accentati, rispetto al tapping regolare. In particolare, una o due pause entro un metro di 4 battiti hanno causato un’accelerazione a lungo termine (Expt. 1) e un pattern di due accenti consecutivi e due non accenti consecutivi hanno causato una decelerazione a lungo termine (Expt. 2). Successivamente, abbiamo osservato grandi differenze individuali in tutti e tre gli esperimenti. Ogni partecipante ha mostrato la propria tendenza all’accelerazione/decelerazione. D’altro canto, alcuni partecipanti hanno mostrato poca variabilità tra diverse condizioni di ritmo/accento, mentre altri hanno mostrato una grande variabilità. Effetti piccoli ma significativi nonostante questa grande differenza individuale implicano che gli effetti del ritmo e dell’accento sulla deviazione del tempo a lungo termine siano costanti. Abbiamo anche scoperto che la modulazione accentata dei toni di risposta potrebbe influenzare il tempo a lungo termine anche quando i partecipanti non hanno provato a riprodurre il modello di accento. In tali casi, la forza del tapping è stata modulata dai toni di risposta (
Figura 6 ), suggerendo che sia i fattori percettivi che quelli motori potrebbero essere coinvolti in questo effetto. Anche gli ITI locali sono stati modulati dai modelli di accento (
Figura 7), ma non c’era una chiara relazione tra tale modulazione forza/ITI locale e deviazione del tempo a lungo termine, il che suggerisce che si tratti di fenomeni diversi. Abbiamo ulteriormente esaminato l’effetto dei toni di risposta utilizzando sequenze di toni modulate dall’intensità (crescendo vs. diminuendo) o dall’altezza (ascendente vs. discendente) e abbiamo riscontrato una significativa accelerazione a lungo termine (ad esempio, pendenza relativa) nella condizione di crescendo (Expt. 3). Inoltre, abbiamo osservato un cambiamento di tempo transitorio subito dopo che i toni target si erano estinti (ad esempio, passaggio dalla fase di sincronizzazione alla fase di continuazione). Questo cambiamento non è stato osservato nella condizione di controllo, ma è stato osservato nella maggior parte delle altre condizioni, comuni a tre esperimenti. In sintesi, i risultati attuali suggeriscono che il processo sensomotorio che produce azioni motorie non regolari e il monitoraggio dei loro risultati può interferire con il meccanismo interno per mantenere intervalli di tempo regolari, sebbene il suo effetto sia relativamente piccolo. L’esecuzione musicale è un compito sensomotorio e cognitivo complesso ottenuto tramite l’integrazione di varie funzioni e quindi molti potenziali fattori possono influenzare il processo di mantenimento del tempo. I risultati attuali hanno dimostrato che la non uniformità delle azioni motorie può essere uno di questi fattori.
Effetto dell’articolazione del tocco sulla deviazione del tempo a lungo termine
Nell’esperimento attuale, abbiamo generalmente osservato una tendenza accelerata comune a molte condizioni, inclusa la condizione di controllo: le pendenze delle linee di regressione della variazione percentuale della lunghezza della barra erano negative nella maggior parte delle condizioni (
Figure 3 ,
5 e
8 ). Abbiamo scelto il tempo target di 132 bpm in base al rapporto secondo cui il tempo di tapping era quasi mantenuto nell’intervallo di 117 e 145 bpm (
Collyer et al., 1992 ). Una possibile ragione di questa tendenza generale all’accelerazione è la distorsione del campionamento: abbiamo reclutato studenti universitari come partecipanti e il loro SMT/SPR potrebbe essere distorto nella direzione più veloce, rispetto a quelli reclutati nello studio precedente. Un’altra ragione è la differenza nel meccanismo della chiave di risposta: abbiamo utilizzato una barra di risposta rigida invece di una chiave di risposta mobile utilizzata nello studio precedente. Questo cambiamento può causare una differenza nel rapporto SMT/SPR dato che il processo motorio è coinvolto nella determinazione del rapporto SMT/SPR (
Loehr & Palmer, 2007 ;
Peckel et al., 2014 ).
La deviazione del tempo osservata nei nostri esperimenti era molto più piccola di quella osservata nell’esecuzione reale del pianoforte da
Mito e Murao (2000) (vale a dire, accelerazione del 15% nell’esecuzione di 15 battute). Ci sono due possibili ragioni per questa discrepanza. Una è che il tempo target del nostro esperimento era vicino a SMT/SPR mentre quello dei loro esperimenti era molto più lento (vale a dire, 70 bpm): la notevole accelerazione osservata nel loro esperimento potrebbe essere dovuta, almeno in parte, alla deriva verso SMT/SPR (
McAuley et al., 2006 ). L’altra ragione sono le differenze individuali. Nei nostri esperimenti, l’effetto dei pattern ritmici differiva notevolmente tra i partecipanti; la deviazione del tempo ha raggiunto il 10-15% per alcuni partecipanti mentre altri partecipanti hanno quasi mantenuto il tempo per ogni condizione (vedere
Figure 3 e
4 ). Queste grandi differenze individuali sono in parte dovute a quelle presenti nel rapporto STM/SPR, considerando che il rapporto STM/SPR dipende da fattori individuali tra cui l’età (
McAuley et al., 2006 ) e l’esperienza musicale (
Drake et al., 2000 ;
Hammerschmidt et al., 2021 ).
Come abbiamo riassunto nella sezione precedente, è stata osservata una significativa accelerazione/decelerazione in alcune specifiche condizioni di ritmo, accento, dinamica e altezza, rispetto alla condizione di controllo. Ad esempio, la pendenza relativa era significativamente diversa da zero quando una o due pause consecutive erano contenute in un metro di 4 battute (condizioni B e C nell’Esperimento 1). Non sappiamo perché solo questi ritmi abbiano avuto un effetto significativo sul tempo a lungo termine. Per essere onesti, ci aspettavamo che un ritmo più complesso avrebbe prodotto una maggiore accelerazione perché avevamo ipotizzato che la non uniformità dell’azione di tapping fosse il punto. Quindi è stato piuttosto sorprendente che sia stato osservato un effetto più significativo per questi pattern ritmici più semplici (rispetto al ritmo puntato).
Allo stesso modo, non abbiamo una ragione chiara per la tendenza del tempo a lungo termine osservata negli esperimenti 2 e 3. Come menzionato nella sezione Background, alcuni fattori musicali, tra cui l’accento (
Bouvet et al., 2020 ;
Tekman, 1997 ), il pattern ritmico (
Drake & Botte, 1993 ;
Wang, 1984 ) e l’altezza (
Lake et al., 2014 ;
Pfeuty & Peretz, 2010 ), hanno effetti sistematici sulla percezione del tempo, ma i nostri risultati non hanno mostrato tali effetti sistematici sulla deviazione del tempo a lungo termine. Plausibilmente, tali fattori influenzano il tempo locale e l’ITI ma hanno scarso effetto sul mantenimento del tempo a lungo termine. Questo punto sarà discusso di seguito.
In sintesi, quindi, il meccanismo di base attraverso il quale una specifica articolazione musicale influisce sul mantenimento del tempo a lungo termine è una questione aperta.
Deviazione ITI locale e deviazione del tempo a lungo termine
Abbiamo esaminato le intensità di tapping e gli ITI per analizzare la relazione tra la forza locale/cambiamento ITI e la deviazione globale del tempo. È stato segnalato che un ITI che precede un accento è stato accorciato, ma uno dopo l’accento è stato allungato (
Billon et al., 1996 ;
Billon & Semjen, 1995 ;
Keele et al., 1987 ;
Semjen & Garcia-Colera, 1986 ). Il risultato mostrato nella
Figura 7 non concorda necessariamente con questa precedente scoperta. In particolare, gli ITI erano quasi gli stessi per tutte le posizioni nella condizione B, sebbene l’accento fosse imposto sul primo e sul terzo battito. Presumibilmente, quindi, la fluttuazione dell’ITI non riflette direttamente la forza delle azioni motorie; può dipendere anche dalla struttura metrica percepita. Ancora più importante, l’entità della fluttuazione dell’ITI non era correlata a quella della deviazione del tempo a lungo termine. Ciò significa che la proprietà di mantenimento del tempo a lungo termine è indipendente dai cambiamenti locali dell’ITI.
Abbiamo osservato che i partecipanti modulavano la forza del tapping in base ai pattern di accento dei toni di risposta anche quando non era richiesto loro di riprodurre i pattern di accento. Ciò sembra plausibile considerando la relazione causale tra l’azione motoria e il suo risultato percettivo. Presumibilmente, i partecipanti (anche inconsciamente) modulavano le loro azioni in modo che il loro risultato percettivo concordasse con i toni di risposta. In questo senso, dobbiamo dire che non siamo riusciti a dissociare completamente tra componenti percettive e motorie in questo esperimento. Il fatto che siano stati osservati pattern simili di deviazione del tempo a lungo termine tra le condizioni automatiche e manuali (
Figura 5(a) ) suggerisce che almeno una parte essenziale del processo percettivo/motorio potrebbe essere comune tra le due condizioni.
Effetto della percezione del tempo
Abbiamo osservato gli effetti della sonorità e del contorno del tono dei toni di risposta alla deviazione del tempo a lungo termine nell’esperimento 3 (
figura 8 ). Risultati precedenti hanno mostrato che la percezione del tempo era modulata da vari fattori musicali, come l’accento (
Bouvet et al., 2020 ;
Tekman, 1997 ), staccato vs. legato (
Geringer et al., 2006 ,
2007 ), pattern ritmico (
Drake & Botte, 1993 ;
Wang, 1984 ), tono (
Lake et al., 2014 ;
Pfeuty & Peretz, 2010 ) e contorno del tono (
Boltz, 2011 ;
Collier & Hubbard, 1998 ). Se proviamo a mantenere l’intervallo di tono percepito sotto queste modulazioni, l’intervallo di tapping fisico cambierebbe a seconda delle condizioni di stimolo. D’altra parte, la deviazione del tempo a lungo termine non può essere spiegata semplicemente in base all’effetto di questi fattori. Le pendenze stimate erano negative per tutte le condizioni (
Figura 8(a) ) e le pendenze relative (dalla condizione di controllo) erano anch’esse negative indipendentemente dalle condizioni di volume e altezza (
Figura 8(c) ). Questo effetto di accelerazione coerente a lungo termine è in contrasto con il fatto che gli ITI locali e il loro trend all’interno della sequenza dipendevano dalle condizioni di volume e altezza (
Figura 7(b) ). Pertanto, concludiamo che il volume e il contorno dell’altezza possono influenzare il tempo a lungo termine, ma il suo meccanismo è presumibilmente diverso da quello della modulazione ITI locale.
Cambiamento di tempo transitorio dopo l’inizio della fase di continuazione
Abbiamo osservato un cambiamento di tempo simile a un gradino dopo che i toni target si sono estinti (
Figura 2 ) e lo abbiamo estratto come intercetta della linea di regressione della lunghezza relativa della battuta. La direzione di questo cambiamento di tempo non era necessariamente coerente, ma era più probabile che il tempo rallentasse nell’Esperimento 1 (
Figura 3 ) e fosse più veloce negli Esperimenti 2 e 3 (
Figure 5 e
8 ). Come mostrato nella
Figura 2 (condizione C), il tempo di battitura veniva spesso mantenuto durante la fase di continuazione anche se si osservava questo cambiamento transitorio iniziale; questi due tipi di deviazione del tempo sembrano indipendenti l’uno dall’altro. A nostra conoscenza, questo cambiamento di tempo transitorio non è stato segnalato altrove. È solo una speculazione, ma questo cambiamento di tempo è forse dovuto a qualche elaborazione cognitiva (ad esempio, cambio di compito o cambio di attenzione) o impatto emotivo (ad esempio, stupore) causato dalla perdita improvvisa dei toni target. Si dice spesso che è probabile che si verifichi fretta quando un musicista si sente nervoso nel suonare parti specifiche di un brano (comunicazioni personali con musicisti amatoriali). Pertanto, l’esperimento attuale ha involontariamente catturato tali effetti cognitivi/emotivi sulla deviazione del tempo. Questo punto potrebbe essere ulteriormente investigato testando sistematicamente il cambiamento ambientale sul tempo di tapping. Ciò potrebbe fornire un nuovo indizio per ricercare la causa della fretta nell’esecuzione musicale reale.
Guasto in condizioni di tre battiti
Nell’esperimento 1, più di un terzo dei partecipanti non è riuscito a mantenere il ritmo della condizione D (“due tocchi, una pausa”); hanno prolungato la durata del periodo di pausa (vale a dire, il loro ritmo è diventato vicino a “due tocchi, due pause”). Ciò è stato totalmente inaspettato per gli autori perché gli autori e gli altri membri del laboratorio potevano facilmente portare a termine il compito in questa condizione. Una possibile ragione di questo fallimento è la mancanza di esperienza nel suonare strumenti musicali, in particolare tastiere e percussioni. Tuttavia, questa congettura sembra errata perché alcuni dei partecipanti non riusciti avevano ricevuto una certa formazione nel suonare il pianoforte (acustico o elettrico) mentre alcuni dei partecipanti riusciti non avevano alcuna esperienza nel suonare strumenti. Un altro motivo è l’attenzione o la concentrazione dei partecipanti sul compito attuale: forse si erano abituati alla struttura metrica a 4 tempi durante le sessioni precedenti ed erano stati attratti da questa struttura anche nella sessione della condizione D a causa di una mancanza di concentrazione sul compito attuale. Una terza possibile ragione è che questi partecipanti hanno poche opportunità di essere esposti alla musica a tre tempi: la musica a tre tempi (ad esempio, Valzer e Menuetto) è comune per le persone che hanno familiarità con la musica classica, ma potrebbe non esserlo per le persone che ascoltano/suonano musica popolare. È una questione aperta il motivo per cui molti partecipanti non sono riusciti a mantenere questo ritmo.