alea iacta est bis repetita

Da la Repubblica.it del 23 novembre 2012, a proposito della prova di preselezione per il “concorsone” docenti:

i candidati avranno tutte le informazioni sulla prova preselettiva con risposte a scelta multipla e potranno iniziare a consultare l’Esercitatore, che verrà messo in linea dal ministero, con le 2.500 domande (3.500 con quelle di lingua straniera) predisposte dal Cineca.

Il giorno della prova, ogni singolo candidato si ritroverò davanti ad un computer con un blocco di 50 domande estratte a caso dal pacchetto predisposto dal Cineca: 18 di logica, 18 di comprensione del testo scritto, 7 di lingua straniera e 7 di informatica. Ogni candidato, quindi, avrà una prova diversa dal collega che gli siede accanto.

Per scoprire tutte le domande selezionate e validate per la prova, basta accedere all’applicazione per 50 volte.

Lasciamo perdere il fatto che proporre a blocchi di 50 le 3500 domande predisposte richiede 70 passaggi, e non 50. Lasciamo anche perdere il fatto che le domande di lingua sono 1000 mentre in ciascun blocco di 50 assegnato ai candidati ce ne devono essere sempre 7, per cui esaurirle tutte richiede più di 143 (1000:7) passaggi.

Ma non si può lasciar perdere il fatto che, poiché l’Esercitatore implementato sul sito del ministero sceglie, come succederà il giorno delle prove, 50 domande a caso tra le 3500 disponibili, ogni volta che lo si usa aumenta la probabilità di vedersi assegnata una domanda già vista. E quindi non saranno sufficienti ne 50, ne 70, ne 143 passaggi. In teoria, si potrebbe anche attendere un numero infinito di volte prima di scoprire tutte le domande predisposte.

Chi ha studiato la materia conosce la differenza tra campionamento senza ripetizione (o riposizione, o reimbussolamento) e con ripetizione (o riposizione, o reimbussolamento); ma chi invece non l’ha studiata non deve imparare questi termini per forza.

E’ più semplice pensare al lancio di un dado. Davvero bastano solo sei lanci per ottenere una volta ciascuno dei sei diversi punteggi? Ovviamente no: può benissimo succedere che al primo lancio esca il tre, e così anche al secondo lancio. Il sei per esempio (ma il calcolo è lo stesso per qualunque altro numero) in ogni lancio ha una probabilità pari a 5/6 di non venire osservato. La probabilità di non ottenerlo dopo sei lanci consecutivi è il 33,5% ([5/6]6). Dopo venti lanci, la stessa probabilità è il 2.6% ([5/6]20). Un valore certamente piccolo, ma non del tutto trascurabile.

Lo stesso dicasi per il gioco del lotto. Non bastano 18 estrazioni di 5 numeri per vedere scorrere tutti e 90 i numeri possibili; uno stesso numero può essere estratto più volte, e un altro nemmeno una volta. Tanto è vero che fioriscono i sistemi di giocate (che pure sono irrazionali) basati sui cosiddetti numeri ritardatari.

E così facciamo qualche calcolo anche per il caso in esame. Dopo il primo blocco di 50 domande, le domande inedite sono 3450 su 3500; quindi, la probabilità di estrarre una domanda inedita al primo posto nel blocco successivo è 3450/3500, al secondo posto 3449/3499, al terzo posto 3448/3498, e così via (analogamente all’analisi di un caso di cronaca precedente), di modo che la probabilità di avere un intero secondo blocco di domande mai lette è il 48,5% (il prodotto delle 50 frazioni precedenti). Detto in altre parole, già al secondo giro in più di un caso su due è attesa almeno una domanda già estratta. Per non appesantire troppo il discorso, basti dire che dopo 70 blocchi estratti a caso la probabilità di non avere mai trovato una certa domanda è il 36,5%; dopo 250 blocchi è ancora il 2,7%.

A dire il vero ci sarebbe la possibilità che le 3500 domande vengano esaurite in 70 blocchi successivi di 50 domande. Dobbiamo però trasferirci dal campo della matematica a quello dell’informatica. L’Esercitatore web potrebbe salvare sul pc dell’utente un cookie, cioè un piccolo file di testo dove memorizzare il codice identificativo delle domande già presentate, in modo da pescare ogni volta casualmente tra le domande non ancora proposte. Dubito però che il programma sul sito del ministero sia così raffinato, o meglio, che l’estensore dell’articolo citato pensasse a questo.

P.S.: Pare che l’accesso al similatore sia subordinato all’indicazione del proprio codice fiscale. Il questo modo effettivamente il programma può tenere traccia delle domande già sottoposte ed esaurire tutte le 3500 disponibili in 70 passaggi.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.