Tag Archives: Keynes

THE DOUGLAS PROPOSALS

26 Set

Ramsey_2Riporto la mia traduzione di un interessante articolo di economia di Frank Ramsey il cui testo originale si trova negli Archivi del Dipartimento di Filosofia Scientifica Collezione Speciale dell’Università di Pittsburg (al Box n.7, folder 3 parte 1)

Si tratta della contestazione di una teoria economica, con purtroppo ancora dei seguaci, che si basa su un errore di logica non facilmente determinabile se non attraverso un corretto ragionamento partendo da casi semplici e con un sistema di analisi più complesso per contenere tutti i casi possibili.

Clifford Hugh Douglas (1879 -1952) sosteneva (L’illusione della Super – Produzione dell’anno 1918, Democrazia economica – Il credito e la democrazia dell’anno 1920)  che la somma di stipendi, salari e dividendi sono inferiori ai prezzi dei beni e servizi prodotti settimanalmente e pertanto i lavoratori non possono avere denaro sufficiente ad acquistare i beni ed i servizi prodotti. Ne conclude che il sistema della contabilità rende tecnicamente impossibile la consegna di merci e servizi e quindi il sistema è costruito per massimizzare i profitti di chi ha il potere economico (questo forse è vero, ma per altri e più banali motivi) e realizzare un’inutile scarsità. Il ragionamento appare, a prima vista plausibile, ma è errato nella maggior parte dei casi come dimostra Ramsey.

Questo saggio rivela il brillante ingegno matematico di Frank Ramsey e la sua capacità di operare in ambiti logici diversissimi. Secondo quanto riportato da Keynes gli economisti si recavano da lui per avere conferma o contestazione delle loro elaborazioni oppure per tradurre in formule le loro valutazioni.

Credo che questo genio ci manchi molto nella situazione attuale.

Vorrei notare come nelle sue dimostrazioni sia molto chiaro l’ambito di applicabilità ed i limiti delle teorie che espone. Purtroppo è una qualità che manca a molti attuali economisti che operano, spesso con effetti catastrofici, con teorie molto matematiche e poco coerenti con le condizioni al contorno o quelle della realtà. Per non parlare di chi usa formule matematiche di terzi senza sapere dove si possono applicare e le applica a sproposito in situazioni che nulla hanno a vedere con l’analisi che si vuole fare.

Quindi c’è da sperare che anche le formule esposte in questo articolo non vengano prese ed usate a sproposito.

Questa è la traduzione.

I CONCETTI PROPOSTI DA  DOUGLAS

A chi è interessato ai concetti proposti da Douglas raccomanderei di studiare Dividendi per tutti, di W. Allen Young, un libretto da sei penny in possesso di evidenti vantaggi sia in termini di brevità e chiarezza rispetto all’esposizione del Maggiore Douglas stesso che è sempre oscuro e spesso assurdo. Le affermazioni più importanti si possono trovare nelle pag. 13 e 20.

(1) ” Si sostiene che i salari, gli stipendi e i dividendi emessi in qualsiasi periodo unitario di tempo non sono mai sufficienti ad acquistare i prodotti finali immessi per la vendita durante lo stesso periodo. ”

(2) “Un nuovo fondamento per i prezzi. – I beni di uso finale (ad esempio il carbone per uso domestico) saranno venduti a meno del loro costo, alla stessa frazione del costo (che è quello che include tutti i dividendi e utili) come il Consumo Totale di tutte le Merci sostiene  la Totale Produzione di Credito Effettivo durante uno specifico periodo di tempo. Con questo metodo, i prezzi attuali sarebbero ridotti a circa un quarto del costo totale ……..

“il Governo rimborserà ai proprietari (ad esempio, i proprietari di miniera di carbone) la differenza tra il costo complessivo sostenuto, e il loro prezzo totale ricevuto, per mezzo di buoni del Tesoro, tali buoni verrebbero addebitati come avviene adesso sul conto del Debito Nazionale.”

A favore di (1) Young afferma: “ll prezzo è quindi costituito da due grandi somme erogate dal Produttore: (A) Tutte le somme versate per le materie prime e spese generali, e (B) tutti gli importi versati in salari, stipendi e dividendi. Quindi il prezzo è uguale a (A) più (B). Ma il denaro pagato come(B) è tutto il denaro che al consumatore di questo paese è dato per comprare le merci che lui stesso aiuta a produrre con la propria attività manuale, con il cervello o con il capitale ….. Pertanto, (B), la quantità di denaro totale emessa, non sarà mai sufficiente a comprare tutte le merci il cui prezzo è (A) più (B). ”

Quindi afferma “È stato sostenuto dagli oppositori a questo schema che di nove fabbriche che forniscono prodotti finali per il consumo questo può essere vero; ma che nello stesso periodo di tempo una decima fabbrica produrrà merci intermedie che non rientrano nel mercato al consumo, ma in relazione alle quali vengono emessi i salari, gli stipendi e dividendi  che possono assorbire l’eccedenza dagli altri nove.” Oltre alla precisione o meno del rapporto di nove a uno, questo argomento è molto semplice e sembra mostrare una vera e propria falla nel ragionamento di Douglas, in modo che è fondamentale esaminare attentamente ciò che Young dice in risposta ad esso. La sua risposta è triplice : –

“(a) La moneta emessa dalla decima fabbrica non poggia su una relazione matematica definita rispetto al valore del prezzo dei beni di consumo finali immessi sul mercato dalle altre nove fabbriche, e non sarebbe sufficiente a bilanciarli se i relativi prezzi rimangono stabili.”

Ma mentre questo non gli sta bene esiste una relazione matematica precisa, dal momento che egli stima che il deficit totale di potere d’acquisto pari a 1 : 4. E in ogni caso l’affermazione che il denaro può o non può essere sufficiente non può essere considerata come una prova che non sia sufficiente.

” (b) Ma i loro prezzi non rimangono costanti. I grossisti e i dettaglianti, quando il denaro della decima fabbrica entra nel mercato, trovano che la domanda è salita senza che la produzione sia cresciuta. Essi quindi aumentano i prezzi. In altre parole, l’effetto del denaro introdotto dalla decima fabbrica non è di eliminare l’eccedenza di tutte le merci in eccedenza delle altre nove, ma solo di eliminare qualcuna di queste, fino a che un aumento dei prezzi bilanci la nuova moneta introdotta nel mercato. Così i prezzi crescono per chi ricava denaro dalle altre nove fabbriche, che rende ancora più impossibile per questi (che ricava denaro dalle altre nove fabbriche) di acquistare tutti i beni di prodotti finali, se lo volessero fare.”

Questo argomento fallisce lo scopo; quello che viene suggerito, in risposta alla tesi di Douglas è che nello stesso periodo di tempo altre fabbriche produrrebbero merci non per il consumo immediato e che i salari e i dividendi versati da quelle fabbriche potrebbero costituire una distribuzione di potere d’acquisto sufficiente a consentire che il surplus venga acquistato . Come è evidente, i salari dei lavoratori che producono prodotti intermedi, come il carbone per uso industriale, sono un fattore sempre presente nella domanda di beni di consumo; non ha senso parlare di un aumento dei prezzi quando questi salari entrano nel mercato.

Ma anche se non fallisse lo scopo, l’asserzione non è plausibile . Ex hipotesi è impossibile vendere, anche al costo, una gran parte dei beni di consumo prodotta. Se poi ci fosse qualche concorrenza, è poco probabile che i prezzi saliranno al di sopra dei costi in qualche misura apprezzabile.

” (c) Anche nel periodo successivo di tempo i costi totali della decima fabbrica entrano nei prezzi dei beni finali prodotti dalle altre nove “. (Certamente.) ” Così la velocità del flusso del potere di acquisto è sempre minore della velocità di flusso dei prezzi. “Questo è ciò che sta cercando di dimostrare, e chiaramente non consegue dall’osservazione precedente. Questo argomento è una mera affermazione del punto da provare.

Usiamo “prezzo di costo ” per includere il conservare il capitale, ma non il costo per aumentarlo, questo è ovviamente il corretto utilizzo, ed è, penso quello di Douglas e dei suoi seguaci. Abbiamo visto che non sono stati avanzati motivi da Douglas per pensare che il rapporto, che il prezzo di vendita deve dare rispetto al prezzo di costo se il potere d’acquisto distribuito è in grado di acquistare tutti i beni di consumo prodotti, sia inferiore all’unità. Ma questo può, tuttavia, essere il caso.

Vi è, tuttavia, un argomento forte e semplice per supporre che il rapporto non differisca sensibilmente dall’unità. Perché è facile vedere che in uno stato stazionario, cioè quello in cui la produzione va avanti a un ritmo immutabile e i prezzi, i salari e la ricchezza nazionale non cambiano mai, il rapporto sarebbe l’unità. Perché in un tale stato il tasso di flusso del costo dei beni di consumo prodotti è A + B con la notazione introdotta qui sopra, dove A , B vengono sommati per tutte le fabbriche che producono beni di consumo. Il potere d’acquisto è distribuito da queste fabbriche in ragione di B. Ma il tasso degli altri pagamenti A essendo fatto da queste fabbriche, rappresenta i pagamenti dei dividendi e dei salari fatte in un momento precedente da altre fabbriche che producono prodotti intermedi. Pertanto, nell’ipotesi di produzione immutabile , la distribuzione del potere d’acquisto da tutte queste altre fabbriche procede al tasso A. In modo che il tasso globale di distribuzione o potere d’acquisto è A + B, che equivale al tasso di flusso del prezzo di costo dei beni di consumo. Poiché il rapporto è l’unità per uno stato stazionario, è improbabile che allo stato attuale differisca notevolmente dall’unità, perché lo stato attuale non è molto lontano dall’essere stazionario.

Ma è possibile utilizzando alcune complicate operazioni matematiche dimostrare che il rapporto è l’unità sotto condizioni molto più ampie, che consentono di tenere conto di variazioni della quantità di produzione, del tasso dei salari, della produttività del lavoro, della ricchezza nazionale. La prova di questo è riportata di seguito, ma saranno in grado di seguirla solo quelli  che hanno familiarità con l’integrazione per parti.

Partiamo dal presupposto che tutto il lavoro è esprimibile in termini di unità o di lavoro . Che i risultati del lavoro sono merci, non necessariamente prodotti finiti, ma può darsi miglioramento di  merci e, in ogni caso esprimibile in termini di unità che dobbiamo chiamare, in mancanza di meglio, unità di merce. La nozione di merce comporta la nozione di utilità, in modo che le merci meno utili conterrebbero meno unità di merce. Chiameremo la produttività del lavoro in un dato momento il numero di unità di merci derivanti da una unità di lavoro ad un certo istante. La produttività per esempio si ridurrebbe se terreni meno fertili vengono messi in coltivazione, e aumenterebbe se la produzione fosse organizzata in modo più efficiente.

Sia T l’istante di tempo considerato.

Siano W(T) i salari pagati per unità di lavoro all’istante T.

Sia P (T) la produttività del lavoro all’istante T.

Quindi il numero di unità di lavoro necessari per produrre un’unità di merce è 1 / P ( T ), e il suo costo è W (T) / P (T).

Il tasso al quale vengono aggiunte unità di merce al tempo T ai beni che saranno effettivamente completi e  disponibili per il consumo al tempo t successivo sarà chiaramente funzione sia di T sia di t. Dobbiamo porre alcune ipotesi circa la forma di questa funzione, e l’unica che sembra condurre ad un’analisi funzionale è che la funzione in questione è il prodotto di una funzione di T e una funzione di t: vale a dire, che le proporzioni in cui al tempo T il lavoro viene speso per beni che saranno disponibili per il consumo a diversi intervalli di tempo è indipendente da T. (Questa ipotesi potrebbe essere incompatibile con le  fluttuazioni industriali e quindi implicare una semplificazione o valutazioni sulla media dei processi). Indichiamo questo prodotto con F (T) f (t). Quindi i salari pagati in ragione di unità di merce aggiunta al tempo T ai beni che saranno effettivamente pronti per il consumo al successivo tempo t  saranno F (T) f (t) W (T) / P (T) , e noi proponiamo di abbreviare e scrivere B (T) f (t).

Assumiamo un tasso costante continuo di interesse r, in modo che se z è la quantità di capitale C dopo il tempo t abbiamo dz / dt = rz, che fornisce z = Cert; e questo è anche il costo sostenuto in qualsiasi momento dopo aver speso C al tempo t in precedenza.

Per motivi pratici, è lecito ritenere che il periodo massimo tra l’inizio del lavoro su un bene e il suo completamento non superi una certa quantità finita t0.

Possiamo ora definire il capitale nazionale in possesso di chi controlla l’industria in qualsiasi momento pari alle merci incomplete accumulate al prezzo di costo (comprensivo di interessi), e supponiamo che un equivalente esatto in titoli ed azioni sia stato distribuito al pubblico a cui i controllori pagano interessi al tasso r, e che la variazione di questo capitale sia sempre accompagnata da un pari ammontare di nuovi prestiti da parte del pubblico o dal rimborso di tali prestiti.

La velocità di flusso dei prezzi di costo dei beni che diventano disponibili per il consumo al tempo T è

Schermata 2014-01-04 alle 21.04.05

perché il prodotto B (T – t ) f ( t ) rappresenta i salari pagati al tempo T – t in conto dei beni che diventano disponibili al successivo tempo t, cioè al tempo T, e il fattore di ert è inserito al fine di ottenere il costo effettivo sostenuto quando l’interesse viene preso in considerazione . Allo stesso modo la velocità con cui i salari vengono pagati al tempo T è

Schermata 2014-01-04 alle 21.16.04

Anche il capitale nazionale al tempo T come definito sopra è

Schermata 2014-01-04 alle 21.16.49

Perché B (T-u) f ( t) dt rappresenta i salari pagati al momento T-u in conto dei beni che si renderanno disponibili fra il tempo t e il successivo t + dt; e stiamo considerando solo i beni che sono incomplete al tempo T, vale a dire, al tempo u successivo a T-u , dobbiamo integrare dal valore minimo di t ovvero u , al valore massimo t0 , così che

Schermata 2014-01-05 alle 15.35.14

rappresenta i salari pagati al momento T-u per tutti i beni che risulteranno incompleti al tempo T; il fattore e si inserisce come prima, al fine di tener conto degli interessi.

I dividendi essendo versati al pubblico in qualche istante di tempo ammonteranno a r volte il capitale nazionale.

Il tasso al quale vengono costituiti nuovi prestiti da parte del pubblico è il coefficiente differenziale con riferimento al momento del capitale nazionale, vale a dire dC (T) / dt .

Supponiamo ora che x (T) sia il rapporto che abbiamo cercato di trovare, cioè il rapporto che i prezzi di vendita dei beni di consumo dovrebbero avere sui prezzi di costo al tempo T in modo che non ci sarebbe né un accumulo di beni di consumo invendibili né di potere d’acquisto invendibile nelle mani del pubblico. Quindi uguagliamo il tasso totale a cui il pubblico riceve il potere d’acquisto in forma di salari e dividendi con i prezzi d’acquisto delle merci risultanti disponibili per il consumo ed il tasso a cui il pubblico costituisce nuovi investimenti, quindi abbiamo

Schermata 2014-01-05 alle 15.59.18

Mostreremo ora che questa equazione può essere soddisfatta solo se x (T) = 1 .

Perché, integrando per parti il coefficiente di x ( T ) e assumendo che B ( T ) sia continua e derivabile, abbiamo

Schermata 2014-01-05 alle 15.59.37

e un confronto di questa equazione con l’ultima mostra che x (T ) = 1 .

Abbiamo ottenuto questo risultato imponendo determinate condizioni, ed è interessante vedere come il risultato è influenzato dalle variazioni di condizioni. La prima condizione che, nel calcolo dei costi, l’interesse è preso ad un tasso fisso r, non possiamo farne a meno; ma in condizioni modificate potremmo ammettere un tasso variabile di interesse sugli investimenti calcolando i dividendi al tasso r su un capitale nominale. L’altra condizione stabilita era l’uguaglianza del capitale nominale con il capitale nazionale come definito, e che le variazioni di questo siano  sempre accompagnate da nuovi investimenti o dal rimborso di investimenti . Passiamo fare a meno di queste condizioni e chiamare Q (T) il capitale nominale al tempo T e supponiamo che L (T), che definiamo come il tasso (positivo o negativo) a cui il pubblico investe il denaro, non sia necessariamente uguale a dQ (T) / dt . Quindi l’equazione per x ( T ) diventa

Schermata 2014-01-05 alle 16.22.50

Abbiamo visto che se sostituiamo C (T) con Q (T) e dC (T) / dT con L (T) allora x (T) = 1 . Ne segue che x (T) è maggiore o inferiore all’unità , a seconda se

rQ (T) – L T) > oppure < rC (T) – dC (T) / dt ,

o se

r { Q (T) – C (T) } > oppure < L (T) – dC (T) dT .

Possiamo riassumere i principali casi in cui x (T) < 1 , come segue : –

(1) Supponiamo che L (T)= dQ (T) / dt , cioè , l’aumento del capitale nominale sia accompagnato da nuovi uguali investimenti; allora x (T) < 1 se dZ (T) / dt > rZ (T) , dove Z ( T) è uguale a (Q(T) – C(T) ), e può essere chiamata la capitale fittizio .

Quindi;

(a) Z ( T ) > 0, ( cioè , lo stato è sovracapitalizzato) – in questo caso il tasso di aumento di capitale fittizio deve superare il tasso di interesse; una situazione che non può essere mantenuta a lungo, così questo caso non è importante

Oppure ( b) Z (T) < 0 , cioè , le stato è sottocapitalizzato – in questo caso x (T) < 1, a meno che il tasso percentuale di aumento della sottocapitalizzazione superiore al tasso di interesse (ad esempio, uno stato socialista non paga alcun interesse, ma calcolandolo come un elemento di costo venderebbe chiaramente sotto costo).

(2) Supponendo che Q (T) = C (T), cioè, non vi è capitale fittizio, allora x (T) < 1 se L (T) > dC(T) / dT cioè , > dQ (T) / dT . Questo potrebbe solo normalmente accadere se nuovi investimenti portassero interessi ad un tasso s (poniamo ) < r, tasso a cui l’interesse è stimato in termini di costo. In questo caso l’ipotesi Q (T) = C (T) significa che il tasso di nuovi investimenti da’ al tasso di incremento del capitale nazionale il rapporto r : s.

Così che le uniche circostanze importanti alle quali dobbiamo vendere sotto costo, vale a dire 1(b), quando i dividendi vengono pagati meno del capitale nazionale; e la (2) quando il tasso di interesse sui nuovi investimenti è inferiore a quello in cui l’interesse è calcolato come un elemento di costo, sono come sarebbe ovvio per il senso comune ed è chiaramente irrilevante la tesi del Maggiore Douglas che “giusto prezzo” è oggi un quarto del prezzo di costo.

F.P. Ramsey

Frank Ramsey: FURTHER CONSIDERATIONS – Capitolo VIII di The Foundation of Mathematics e Parte C. di Last Papers

22 Giu

Ramsey_2Propongo la mia traduzione delle parti del testo di Frank Plumpton Ramsey aggiuntive all’esame dei sistemi di valutazione delle probabilità. Si tratta del capitolo VIII di The Foundation of Mathematics e la sezione C. del capitolo IX ‘Last Papers’.

Si tratta di una serie di elementi aggiuntivi e correttivi della teoria esposta nel capitlo VII.

VIII

ULTERIORI CONSIDERAZIONI (1928)

A. RAGIONEVOLE GRADO DI CONVINZIONE

Quando passiamo oltre ragionevole = mio, o = scientifico, il definirlo in modo esatto è proprio impossibile. Seguendo Peirce, lo affermiamo per un’abitudine non per un giudizio individuale. Approssimativamente, un ragionevole grado di convinzione = proporzione di casi in cui questa abitudine porta alla verità. Ma nel cercare di essere più precisi si incontrano le seguenti difficoltà:

(1) Non si può sempre prendere l’abitudine presente: potrebbe in modo corretto essere derivata da una qualche precedente esperienza accidentalmente fuorviante. Allora guardiamo ad una più larga abitudine a formare una tale abitudine.

(2) Non possiamo fornire una percentuale di casi reali; ad esempio in un gioco di carte a cui si gioca molto raramente, così che delle particolari combinazione in questione ci sono pochissimi casi effettivi.

(3) A volte effettivamente accettiamo una teoria del mondo con alcune leggi e alcune possibilità, e intendiamo non la percentuale dei casi effettivi ma quale è la probabilità della nostra teoria.

(4) Ma si potrebbe sostenere che questa complicazione non sarebbe necessaria a causa della (1) per la quale noi prendiamo in considerazione solo le abitudini molto generali, delle quali ci così sono tanti esempi che, se la probabilità secondo la nostra teoria differisse dalla percentuale effettiva, la nostra teoria dovrebbe essere sbagliata.

(5) Anche in un caso basilare come l’induzione, potrebbe non esserci alcuna possibilità per esso: questo non è il caso di cose riguardanti una probabilità.

Fortunatamente non vi è alcun motivo per fissare in un preciso il senso di ‘ragionevole’; questo potrebbe essere imposto solo per uno o due motivi: o perché il ragionevole sarebbe il soggetto argomento di una scienza (che non è il caso); o perché ci aiuterebbe ad essere razionali per conoscere cosa è una ragionevolezza (che non ci aiuta, sebbene alcune false opinioni potrebbero impedircelo). Per rendere chiaro che non è necessario per ambedue questi scopi si deve considerare (1) il contenuto della logica

e (2) l’utilità della logica.

IL CONTENUTO DELLA LOGICA

(1) Preliminare all’indagine filosofico-psicologica sulla natura del pensiero, sulla verità e ragionevolezza.

(2) Formule per la deduzione formale = matematica.

(3) Indicazioni per evitare confusione (appartiene alla psicologia medica).

(4) Schema della maggior parte delle proposizioni generali conosciute o utilizzate come abitudini di inferenza da un punto di vista astratto; o rozzamente induttivo, come ‘il metodo matematico ha risolto tutti questi altri problemi, quindi … ‘, oppure sistematica, quando viene chiamato metafisica. Tutto questo potrebbe ad ogni modo essere chiamato metafisica; ma è considerato come la logica, quando addotto come avente relazione con un problema irrisolto, non semplicemente come informazione interessante per personale interesse.

L’unica di queste che è una scienza distinta è evidentemente la (2).

L’UTILITÀ DELLA LOGICA

Quella delle sopra indicate (1) (3) sono evidenti: quelli interessanti sono le (2) e (4). (2) = la matematica è indispensabile per manipolare e sistematizzare le nostre conoscenze. Oltre a questo (2) e (4) ci aiutano a in qualche modo a pervenire a delle conclusioni nel giudizio.

 LOGICA COME AUTOCONTROLLO (cfr. Peirce)

L’autocontrollo, in generale, significa o

(1) non agire in base al desiderio temporaneamente dominante, ma fermarsi a riflettere bene su questo; cioè porre attenzione a tutti i desideri e verificare quale è effettivamente il più forte; nella valutazione di questo consiste l’eliminazione delle incoerenze nell’agire;

o (2) disporre come risultato di una abitudine decisionale abitudini ad agire in risposta non a desideri o stimoli occasionali, ma in un modo deciso adeguato ad un desiderio stabile.

La differenza è che in (1) ci fermiamo a pensarci bene ma in (2) ci abbiamo pensato bene prima e ci fermiamo solo a fare ciò che avevano precedentemente deciso di fare.

Così anche la logica ci permette di

  1. Non formulare un giudizio sulla base delle prove immediatamente davanti a noi, ma a fermarci a pensare a tutto il resto che noi riteniamo in qualche modo pertinente. Ci permette di non essere incoerenti, e anche di porre attenzione alle questioni veramente generali, ad esempio, tutti i corvi che ho visto sono di colore nero, così questo sarà – non un corvo; il colore è in determinate altre specie di uccelli una qualità variabile.. Così, ad esempio non solo argomentare da φa, φb …a (x).φ(x) come probabile, ma il considerare che il sostenere che a, b. . . siano la classe che ho visto (e quelle visibili sono in modo particolare probabilmente o improbabilmente φ). Questa differenza tra selezione influenzata e casuale. 1

1 Vedi infra ‘Chance’.

(2) Il formare certe abitudini fisse di procedura o di interpretazione solo riviste ad intervalli quando pensiamo bene sugli oggetti. In questo è lo stesso di qualsiasi giudizio generale; dobbiamo solo considerare il processo come ‘logico’ quando è molto generale, non ad esempio aspettarsi che una donna sia infedele, ma ad esempio di respingere coefficienti di correlazione con un errore probabile più grande di loro.

Per quanto riguarda la formazione di un giudizio o una giudizio parziale (che è una decisione che corrisponde ad un grado di convinzione di un certo grado, cioè ad agire in un certo modo), si deve notare che: –

(a) Quello che domandiamo è ‘p?’ non ‘Sarebbe giusto pensare p? ‘Né ‘ Sarebbe ragionevole pensare p? ‘ (Ma questi potrebbero essere utili primi passi.)

ma (b) ‘Sarebbe vero pensare p?’ non può mai essere determinata senza determinare a cosa corrisponda p.

(c) ‘Sarebbe ragionevole pensare p?’ significa semplicemente ‘ è p quanto accade di solito in un caso del genere?’ ed è vago come ‘solito’. Porre questa domanda ci potrebbe aiutare, ma spesso non sembra più facile rispondere che p stessa.

(d) non può neppure essere fissato il preciso significato in cui ‘ragionevole’ o ‘solito’ può essere utilmente adottato, né assegnato un peso per qualche principio a diverse considerazioni di tal sorta. Ad esempio il tasso di mortalità per gli uomini di 60 anni è di 1/10, ma tutti i 20 sessantenni dai capelli rossi che ho conosciuto hanno vissuto fino a 70 anni. Cosa mi dovrei attendere dei nuovi sessantenni dai capelli rossi? Non posso che mettere le prove davanti a me, e lasciare che agiscano nella mia mente. Vi è un conflitto di due ‘di solito’, che deve venir elaborato nella mia mente; uno non è realmente ragionevole, l’altro è effettivamente ragionevole.

(e) Tuttavia, quando la prova è molto complicata, le statistiche vengono introdotte per semplificarla. Queste devono essere scelte in modo tale da influenzare me quanto più possibile nello stesso modo come farebbe l’insieme dei fatti che essi rappresentano se riuscissi a comprenderli con chiarezza. Ma questo non può essere del tutto ridotto a una formula; il resto della mia conoscenza può influenzare la questione; quindi p può essere equivalente in influenza a q, ma non ph a qh.

(f) Ci sono casi eccezionali in cui ‘Sarebbe ragionevole pensare p’ risolve completamente l’argomento. Così, se ci viene detto che uno dei nomi di queste persone inizia con A e che ci sono 8 di queste persone, è ragionevole credere con grado un ottavo che il nome di qualche particolare nome inizia con A, e questo è ciò che dovremmo fare tutti (a meno che non sentissimo che ci sia qualche qualcosa di pertinente).

(g) Tuttavia, introdurre l’idea di ‘ragionevole’ è in realtà un errore; ma sarebbe meglio dire ‘solitamente’, che rende evidente l’indeterminatezza dell’insieme: ciò che è ragionevole dipende da ciò che viene assunto come importante; se assumiamo come abbastanza importante, se è ragionevole pensare p diventa almeno un problema difficile come p. Se prendiamo tutto come importante è la stessa cosa.

(h) Cosa dovremmo prendere come importante? Quel genere di cose che è utile prendere come importanti; se mettessimo in relazione con l’essere importante con riferimento a quello che assumiamo come importante, questo potrebbe significare ogni cosa. Altrimenti è impossibile affermarlo; ma il problema è quello posto dall’osservatore non dalla persona stessa che pensa: se il pensatore sente un oggetto importante non può eliminarlo; e se lo sente irrilevante non potrà usarlo.

(i) Solo quindi, se sentiamo in realtà essere molto poco importante, o rispondiamo o possiamo rispondere alla domanda con un riferimento a ciò che è ragionevole, essendo questo quindi equivalente a ciò che noi riconosciamo e consideriamo importante.

(j) Quello che viene o non viene preso come importante sono non solo le proposizioni ma anche gli oggetti formali, ad esempio a=a: noi possiamo reagire diversamente a φa che a qualsiasi φx non per qualcosa che sappiamo circa a ma ad esempio per ragioni emotive.

 B. STATISTICHE

La scienza statistica si occupa di sintesi di fatti circa numerosi individui che vengono interpretati come una selezione casuale da una ‘popolazione’ infinita. Se le qualità in questione sono discrete, questo significa semplicemente che si considerano le percentuali degli individui osservati che hanno certe qualità, e attribuire queste percentuali alla ipotetica popolazione. Se le qualità sono continue, assumiamo che la popolazione sia di una opportuna forma semplice contenente vari parametri che vengono poi scelti per dare la massima probabilità agli esempi oggetto di osservazione. In entrambi i casi l’errore probabile viene calcolato per un certo campione estratto da una certa popolazione. (Per tutto questo si veda Fisher).1

Il significato di questa procedura è che registriamo in una semplice conveniente forma

(1) Le percentuali approssimative aventi le caratteristiche date in gradi diversi,

(2) Il numero di esempi che abbiamo osservato (il peso della nostra induzione) (errore probabile).

Per l’utilizzo dei numeri per dare un grado di convinzione per quanto riguarda un nuovo esempio non può essere data nessuna regola.

L’introduzione di una popolazione infinita è una invenzione stupida, che non può essere difesa se non attraverso qualche riferimento a procedure ad un limite, che ne distrugge il significato. La procedura di calcolare i parametri per massima verosimiglianza e probabile errore può essere definito come un processo di matematica pura; il suo significato è nel suggerire una teoria o un insieme  di probabilità. La percentuale di una popolazione infinita dovrebbe essere sostituita dalla probabilità.

Ovviamente lo scopo non è sempre la semplice induzione ma l’analisi causale: troviamo che le probabilità non sono quello che ci aspettiamo, quindi o il dado è truccato o adesso le persone sono più accurate, ecc.

1 “Teoria della stima statistica,” [p.204] RA Fisher, Proc. Camb. Phil. Soc., 22, pp.700-725 (1925), and Statistical Methods for Research Workers.

C. PROBABILITA’

(1) Non esistono cose come probabilità oggettive, nel senso in cui alcune persone immaginano che ci siano, ad esempio, N. Campbell, Nisbet.1

Non esiste, per esempio, nessun dato di fatto nella forma ‘In n consecutivi lanci il numero di teste si trova compreso tra n/2±ε(n)’. Al contrario, abbiamo buoni motivi di ritenere che una legge del genere sarebbe rotta, se prendiamo abbastanza casi di questi lanci.

Né esiste un qualche dato di fatto determinato empiricamente su una serie infinita di lanci; questa formulazione viene adottata solo per evitare una contraddizione con l’esperienza; e ciò che nessuna esperienza può contraddire, nessuna esperienza può confermare, permette solo di non parlare di enunciarlo.

(N. Campbell fa un semplice errore in questo.)

Una teoria grezza della frequenza è inammissibile poiché essa giustifica la ragione della ‘maturità delle probabilità’, ad esempio con riguardo al sesso della prole.

(2) Quindi le probabilità devono essere definite attraverso i gradi di convinzione; ma essi non corrispondono a nessuno effettivo grado di convinzione; le probabilità di 1.000 volte tasta e di 999 seguita da croce, sono uguali, ma tutti si aspetterebbero più le prime rispetto alle seconde.

(3) Le probabilità sono gradi di convinzione all’interno di un determinato sistema di convinzioni e di gradi di convinzione; non quelli di qualsiasi persona reale, ma in un sistema semplificato a cui quelli di persone reali, specialmente di chi parla, in parte si approssimano.

(4) Questo sistema di convinzioni è costituito, in primo luogo, delle leggi naturali, che sono in questo date per certe, sebbene, naturalmente, le persone non siano in realtà abbastanza sicure di queste.

(5) Oltre a ciò il sistema contiene vari oggetti di questo genere: quando conoscendo ψx e null’altro di importante, si aspetta sempre φx con grado di convinzione p (ciò che è o non è importante è anche specificato nel sistema); che si può anche scrivere che la probabilità di φ dato ψ è p(se p = 1 è lo stessa cosa di una legge). Queste probabilità insieme con le leggi formano un sistema deduttivo secondo le regole di probabilità, e le convinzioni effettive di un utilizzatore del sistema dovrebbe approssimarsi a quelle dedotte da una combinazione del sistema e dalla particolare conoscenza di fatto posseduta dall’utente, questo ultimo essendo (inesattamente) assunto come determinato.

1 R.H. Nisbet, “The Foundation of Probability”, Mind, 1926.

(6) Le probabilità di un tale sistema non devono essere confuse con le frequenze; la probabilità di φx dato ψx potrebbero essere anche diverse dalla frequenza conosciuta di ψ che è φ. Ad esempio la probabilità di una moneta  di dare testa ieri è 1/2 dal momento che ‘ieri’ è irrilevante, ma la percentuale che effettivamente ha dato testa ieri potrebbe essere 1.

(7) E’ evidente, tuttavia, che non siamo provveduti di sistemi che forniscano un grado di convinzione in ogni possibile proposizione per qualsiasi base di conoscenza dei fatti. I nostri sistemi coprono solo parte del campo; e dove non abbiamo un sistema diciamo che non conosciamo le probabilità.

(8) I fenomeni che hanno probabilità sistematiche sono giochi d’azzardo, nascite, morti, e tutti i tipi di coefficienti di correlazione

(9) Cosa si intende per probabilità oggettiva non è solo il nostro avere nel nostro sistema una probabilità φ(x)/ψ(x), ma nel nostro non avere speranza di modificare il nostro sistema in un paio di leggi αx.ψx.⊃x .φx:βx.ψx.⊃x . ∼φx, ecc., dove αx, βx sono disgiunzioni di proprietà facilmente osservabili (precedenti nel tempo a φx). Questo si verifica, come puntualizza Poincaré 1, quando piccole cause producono grandi effetti.

Le probabilità sono in un altro senso oggettive, nel senso in cui tutti sono d’accordo su di esse, a differenza ad esempio per le scommesse sui cavalli.

(10) Cosa si intende per un evento di non essere una coincidenza, o non essere dovuto al caso, è che se andiamo a conoscerlo, ci costringerebbe a non considerare più a lungo il nostro sistema come soddisfacente, anche se nel nostro sistema l’evento può essere più improbabile rispetto a qualsiasi alternativa. Così 1.000 volte testa nel lancio di una moneta non sarebbe dovuto al caso; cioè se lo osservassimo dovremmo cambiare il nostro sistema di probabilità per il lancio di quel penny. Se questo viene chiamato h, le probabilità nel nostro sistema con h come ipotesi sono molto diverse dai nostri gradi effettivi di convinzione in determinati h.

Dicendo che un oggetto non è dovuto al caso, noi solamente intendiamo che il nostro sistema di probabilità deve essere modificato, non che questo deve diventare un sistema di leggi. Così per una moneta truccata che da’ testa non è dovuto alla probabilità anche se non sempre funziona così; per esempio: la probabilità può essere posta ad esempio = 2/3, non 1/2 .

Se diciamo ‘Il nostro incontro non era dovuto al caso’, cioè programmato, la programmazione è solo un fattore che modifica le probabilità; ma potrebbe anche essere ad esempio che stavamo camminando nella stessa strada.

(11) Questo è il motivo per cui N. Campbell pensa che coincidenze non si possano ammettere che avvengano; vale a dire le coincidenze . ⊃ . un sistema errato, ∴ un sistema . ⊃ . nessuna coincidenza. A quanto pare formalmente coerente; ma questo è un errore perché il sistema non è una proposizione che è vera o falsa, ma un’imprecisa approssimazione di uno stato d’animo in cui alcune imperfezioni possono in determinate circostanze risultare particolarmente evidenti.

1Vedi Science et Hypothèse e Science et Méthode.

(12) Con gli oggetti che sono in ultima analisi, dovuti al caso, intendiamo dire che non esiste una legge (qui una generalizzazione di una complessità maggiore di quella gestibile), conosciuta o sconosciuta, che determina il futuro a partire dal passato. Se supponiamo inoltre che hanno probabilità assolute, questo rappresenta una sorta di sistema migliore in cui avere queste probabilità.

(13) Nella scelta di un sistema dobbiamo risolvere con un compromesso tra due principi: fatta salva la condizione che il sistema non deve contraddire i fatti che conosciamo, scegliamo (essendo un altro oggetto equivalente) il sistema più semplice, e (a parità di condizioni) scegliamo il sistema che dia la più alta probabilità ai fatti che abbiamo osservato. Questo ultimo è di ‘principio di massima verosimiglianza ‘ di Fisher, e fornisce l’unico metodo di verifica di un sistema di probabilità.

(14) La probabilità in fisica significa possibilità come spiegato qui, con alcune possibili complessità aggiunte perché siamo interessati ad una ‘teoria’ nel senso di Campbell, non solo ad un sistema normale che è una generalizzazione della legge di Campbell.’ Cosa sia il caso in una teoria è difficile da spiegare fino a che non sapremo di più sulla natura delle teorie.1

1 [Vedi la sezione seguente – Ed. ]

(15) La scienza statistica deve essere brevemente trattata dal nostro punto di vista; essa ha tre parti

(a) Raccolta e ordinamento di una selezione di dati da un una moltitudine di dati

(b) induzione = formare un sistema di probabilità dei dati mediante il Principio di Massima Verosimiglianza.

(c) analisi causale: ad esempio, questo dado cade così spesso in questo modo in su, quindi il suo centro di gravità deve essere spostato verso la faccia opposta.

(16) L’unica difficoltà è presente in relazione a (c) analisi causale, in cui ci sembra di fare una asserzione di probabilità come un fatto, e di sostenere ‘il dare così spesso sei non è dovuto al caso’‚ ∴ probabilità > 1/6 ∴ centro di gravità spostato. Ragionamento che sembra incompatibile con la nostra soluzione del paradosso che ‘la probabilità = 1/6’, è incoerente con questa coincidenza che era che ‘la probabilità =1/6’, la probabilità >1/6’ non sarebbero proposizioni e pertanto non potrebbero servire come premesse e conclusioni di ragionamenti.

(17) La difficoltà viene rimossa dall’osservazione che il sistema che in definitiva stiamo utilizzando non solo ci fornisce il grado di convinzione o di probabilità di x di dare sei assumendo che x sia lanciato = 1/6, ma anche una probabilità di x di dare sei dato che x viene lanciato ed è truccato >1/6. Di conseguenza, dal recepimento che x è truccato/ x esce sei volte che x è lanciato > che x è truccato/ x è lanciato. Se a/bh> a/h, allora b/ah>b/h e questo è come dovremmo pensare. La probabilità di a che x lanciato dia sei è p sembra si debba trattare come una vera proposizione, ma quello che realmente intendiamo è una condizione non esplicita, che nel nostro sistema nel momento che viene aggiunto alle ipotesi determina la probabilità p.

(18) Possiamo affermare questo così: l’analisi casuale statistica presuppone un sistema basilare all’interno del quale si muove e che lo lascia immutato; questa non è né sembra possa essere trattata come una proposizione. Ciò che sembra si possa trattare così è un più ristretto sistema derivato o derivabile dal sistema principale con l’aggiunta di una premessa empirica, e ciò che è effettivamente trattato come una proposizione e modificato o respinto non è il sistema più ristretto, ma la premessa empirica su cui essa si basa.

Naturalmente questa premessa empirica può essere sconosciuta o molto vagamente conosciuta; ad esempio, concludo dal fatto che sono nati più ragazzi che ragazze da una certa superiorità numerica, una superiore mobilità, o capacità di fecondazione di spermatozoi con caratteri maschili o per una delle mille altre possibili cause, perché per il Principio di Indifferenza, che fa parte del mio sistema fondamentale, la differenza osservata sarebbe così inverosimile se non ci fosse una tale differenza. Ma qui non sembra esserci una differenza fondamentale tra questo caso e la moneta truccata.

(19) Note sul problema di Poincaré ‘Perché gli eventi casuali sono soggetti ad una legge?’ La risposta principale a questo è che non lo sono, assumendo che nell’intero campo degli eventi casuali non sono possibili generalizzazioni su di essi (si pensi ad esempio alle malattie infettive, i dattili negli esametri, i morti per calci di cavalli, le nascite di grandi uomini).

Poincaré dice che è paradossale che l’attuario possa derivare dall’ignoranza così semplici ed utili conclusioni mentre se conoscesse le leggi della salute dovrebbe passare attraverso calcoli senza fine. In realtà egli opera non per ignoranza, ma per esperienza di frequenze.

(20) Nota su ‘casuale’.

Keynes 1 fornisce un resoconto sostanzialmente corretta di questo. Ma

(a) E’ essenziale introdurre il concetto di una descrizione.  Quello che vogliamo non è che a sia un membro  casuale di Schermata 2013-08-22 alle 18.42.59      (Sx) con lo scopo φx, ma la descrizione (ιx)(ψx) è una descrizione casuale quando x= (ιx)(ψx) è trascurabile rispetto a φx/Sx.h.

(b) E’ indispensabile estendere il termine per coprire non solo una selezione di un  termine, ma di molti; quindi, che ψ  Schermata 2013-08-22 alle 18.42.59      fornisce una selezione casuale di n di S in riferimento a φ Schermata 2013-08-22 alle 18.42.59   significa che a= Schermata 2013-08-22 alle 18.42.59    (ψx) è irrilevante alla probabilità nella forma: Rapporto di α che è φ= λ/α∊n.α⊃ Schermata 2013-08-22 alle 18.42.59   (S(x).h.

L’idea di selezione casuale è utile nell’induzione, in cui il valore del ragionamento ‘Un rapporto λ su ψS è uguale a φ’ ∴ che ‘ Un rapporto λ su S è uguale a φ’ dipende se ψ è un selettore casuale. Se λ=1 naturalmente il valore del ragionamento è rafforzato se ψ è affetto da errore sistematico contro φ, indebolito se φ è affetto da errore sistematico in favore di questo.

Treatise on Probability, P.291.

DAL CAP. IX Ultime carte (1929):

C. PROBABILITA’ E CONVINZIONE PARZIALE

Il difetto del mio saggio sulla probabilità era che ho assunto la convinzione parziale come un fenomeno psicologico definibile e misurabile  da uno psicologo. Ma questo tipo di psicologia è molto poco accettabile e sarebbe abbastanza inaccettabile in una scienza sviluppata. In effetti la nozione di un grado di convinzione 2/3 è inutile per un osservatore esterno, tranne quando viene usato dallo stesso che pensa e che dice: ‘Be’, io credo in una certa misura 2/3′, vale a dire (almeno questo è l’interpretazione più naturale)’ Ho lo stesso grado di convinzione in questo come in p v q quando io considero p,q,r ugualmente verosimili e so che uno di essi è vero.’ Ora, qual è il concetto di questo confronto numerico? come viene utilizzato il numero? In un grande numero di casi viene utilizzato semplicemente come base per ottenere altri numeri dello stesso tipo derivandone alla fine in un caso circa prossimo a zero o ad 1 che viene assunto essere 0 o 1 e la parziale convinzione essere una completa convinzione. Ma a volte il numero viene assunto per sé stesso nel prendere una decisione concreta. Come? Vorrei dire conformemente alla legge della speranza matematica, ma non posso farlo, perché potremmo usare solo questa regola se avessimo misurato buoni e cattivi risultati. Ma forse in un certo modo ci avviciniamo ad essa, come avremmo supposto in economia di massimizzare un’utilità non misurata. Il problema si pone anche sul perché proprio questa legge di speranza matematica. La risposta a questo è che se usiamo la probabilità per misurare l’utilità, come spiegato nel mio articolo, allora la coerenza richiede proprio questa legge. Naturalmente se l’utilità fosse misurata in qualsiasi altro modo, ad esempio in denaro, non dovremmo usare la speranza matematica.

Se non sussiste alcun significato nell’equivalente differenza di utilità, allora il denaro è un metodo buono come un altro per misurarla. Un significato può, tuttavia, essere fornito dal nostro metodo probabilistico, o mediante il tempo: ad esempio x – y = y – z se x per 1 giorno e z per 1 giorno = y per 2 giorni. Ma i periodi devono essere lunghi o associato con vite o persone diverse per evitare l’influenza reciproca. Questi due metodi portano allo stesso risultato? Potremmo provarlo con Bernoulli? Ovviamente no; Bernoulli valuta solo le probabilità. Un uomo potrebbe considerare una cosa buona e una cattiva equivalenti a 2 neutre, ma considerare 2 cattive semplicemente come pessime, che non vale la pena di assumere qualsiasi probabilità su di esse (Ma potrebbe essere fatto! No, ci dovrebbe essere una probabilità di non esserlo.) Credo che questo dimostra che il mio metodo di misurazione sia migliore; ma vale solo nell’insieme.

Tutto questo è solo un’idea, che senso c’è davvero in esso? Si può dire, credo, questo: –

Una teoria è un insieme di proposizioni che contiene p e q quando contiene p e q, e se

contiene una qualsiasi p contiene tutte le sue conseguenze logiche. L’interesse di tali insiemi viene dalla possibilità di adottarne una di queste come tutti noi crediamo opportuno.

Una teoria della probabilità è un insieme di numeri associati a coppie di proposizioni che obbediscono al calcolo delle probabilità. L’interesse di tale insieme deriva dalla possibilità di agire su di essi in modo coerente.

Naturalmente, il matematico si occupa solo della forma della probabilità; ma è abbastanza vero che si occupa solo di certezze.

TRUTH AND PROBABILITY- Cap. VII di The Foundation of Mathematics di Frank Plumpton Ramsey

21 Giu

Dennis V. LindleyPropongo la mia traduzione del settimo capitolo di The Foundation of Mathematics di Frank Ramsey pubblicato a cura di R.B. Braithwaite.

Questo capitolo è la base dei moderni sistemi di valutazione in condizioni di incertezza. Grazie a questa magnifica elaborazione matematica di temi complessi e ragionamenti solo in parte elaborati da altri autori tra cui Wittgenstein, Donkin, Pierce e Blake Ramsey ha costruito un sistema matematico solido e straordinariamente valido per la valutazione delle scelte umane basato sull’inscindibilità dei due elementi soggettivi probabilità e utilità dell’esito delle decisioni. Questa metodologia è valida solo per un mondo non deterministico (quindi è il logico e necessario superamento del galileismo nella scienza), libero e razionale. Ramsey prende le mosse dalla contestazione, dal punto di vista logico, dell’ipotesi di Keynes che si possano costruire algoritmi per definire la probabilità in modo oggettivo. Tale metodologia è, purtroppo, ancora in uso da parte di importanti istituzioni pubbliche con la sola finalità di definire le condizioni per non avere problemi con la giustizia se si applicano queste formule. Ma generalmente determina gravi errori di valutazione in quanto rappresenta un metodo per rendere oggettiva una grandezza che non può esserlo in quanto dipende oltre che dalla storia del decisore, dal suo carattere e dal sentimento di utilità che egli attribuisce ad una determinata decisione.

La linea di pensiero di Ramsey è anche importante perché esclude la possibilità di far coincidere l’utilità delle scelte con la teoria filosofica dell’Utilitarismo (qui credo sia ben presente l’influenza di Ludwig Wittgenstein). Si tratta infatti di elementi che apparentemente e solo in taluni casi appaiono convergenti, ma in realtà sono concetti del tutto diversi. L’utilità di una decisione è un numero compreso tra 0 e 1 in quanto si può definire come la probabilità di ottenere la conseguenza migliore per effetto di una decisione.

Rammento ai lettori che il prof. Dennis V. Lindey ha pubblicato sull’argomento un libro divulgativo (Making Decisions- John Wiley and Sons Ltd- 1985) per l’uso del metodo di Ramsey che permette in modo semplice di valutare la coerenza di una decisione indicando i passaggi necessari per pervenirvi. Il concetto di coerenza per le proprie scelte, legato quindi a regole personali, è per definizione un metodo soggettivo che riguarda il singolo decisore.

Il lavoro di Lindley andrebbe completato con l’analisi delle tendenze psicologiche del decisore per rendere maggiormente utile il sistema. 

Il metodo di Keynes, che non tiene conto di questo, porta necessariamente ad errori di valutazione perché è uguale per tutti i decisori. In ultima analisi è un metodo che potrebbe essere gradito ai regimi totalitari o comunque a quei sistemi politici che non considerano la libertà un bene fondamentale e fondante della natura umana.

VII

VERITA’ E PROBABILITÀ (1926)

Dire di che quello che è che non è e di quello che non è che è, è falso mentre il dire di quello che è che è e di quello che non è che non è, è vero. – Aristotele.

Quando diverse ipotesi si presentano alla nostra mente che riteniamo essere reciprocamente esclusive ed esaustive, ma di cui non sappiamo altro, noi distribuiamo equamente la nostra convinzione tra queste…..

Ammettendo questo come motivo del modo in cui effettivamente distribuiamo la nostra convinzione in casi semplici, tutta la successiva teoria segue come deduzione del modo in cui dobbiamo distribuirla in casi complessi, se vogliamo essere coerenti. – W.F. Donkin.

L’oggetto del ragionamento è quello di scoprire, dalla considerazione di quello che già sappiamo, qualcos’altro che non sappiamo. Di conseguenza, il ragionamento è buono  se è tale da dare una vera conclusione da premesse vere, e non altrimenti. – C.S. Peirce.

La verità non può mai essere presentata come se sia da comprendere, e non come se sia da credere. – W. Blake.

PREMESSA

In questo saggio la teoria della probabilità è assunta come un ramo della logica, la logica della parziale convinzione e di materia non completamente definita; ma non vi è alcuna intenzione di implicare che questo è l’unico e anche il più importante aspetto del discorso. La probabilità è di fondamentale importanza non solo nella logica, ma anche nella scienza statistica e nella fisica, e non possiamo essere sicuri in anticipo che la più utile interpretazione di essa nella logica sarà appropriata anche nella fisica. Infatti la differenza principale di opinione fra gli statistici che per la maggior parte adotta la teoria della probabilità sulla base della frequenza e i logici che per lo più la respingono rende probabile che le due scuole stiano veramente discutendo differenti questioni, e che la parola ‘probabilità’ venga usata dai logici in un senso e dagli statistici in un altro. Le conclusioni a cui arriveremo circa il significato di probabilità in logica non devono, pertanto, pregiudicare il suo significato nella fisica.1

1 [Il capitolo finale, sulla probabilità nella scienza, è stato progettato ma non scritto. – Ndr].

SOMMARIO

(1) La teoria della frequenza

(2) La teoria di Keynes

(3) Il gradi di convinzione

(4) La logica della coerenza

(5) The Logica della verità

(1) LA TEORIA  DELLA FREQUENZA

Nella speranza di evitare alcune controversie puramente verbali, mi propongo di iniziare facendo qualche ammissione a favore della teoria della frequenza. In primo luogo, a questa teoria deve essere concesso di avere una solida base nel linguaggio comune, che utilizza spesso ‘probabilità’ praticamente come sinonimo di proporzione; per esempio, se diciamo che la probabilità di guarigione dal vaiolo è di tre quarti, si intende, credo, semplicemente che questa sia la proporzione di casi di vaiolo che guariscono. In secondo luogo, se iniziamo con quello che viene chiamato il calcolo delle probabilità, considerandolo dapprima come un ramo della matematica pura, e poi guardandosi intorno per qualche interpretazione delle formule, che devono dimostrare che i nostri assiomi sono coerenti e il nostro argomento non del tutto inutile, allora la molto più semplice e la meno controversa interpretazione del calcolo è quella in termini di frequenze. Questo è vero non solo della ordinaria matematica della probabilità, ma anche del calcolo simbolico sviluppato da Keynes; perché se nel suo a / h, a e h sono prese per essere non proposizioni, ma funzioni proposizionali o concetti-classe che definiscono classi finite, e per a/h si intende la proporzione di membri di h che sono anche membri di a, allora tutte le sue proposizioni diventano truismi aritmetici.

Oltre a queste due inevitabili considerazioni, ce n’è una terza e più importante, che io sono pronto ad assumere temporaneamente anche se non esprime la mia vera opinione. E questa è la seguente. Supponiamo di Iniziare con il calcolo matematico, e chiedere, non come prima cosa quale interpretazione di esso sia più comoda per il matematismo puro, ma quale interpretazione fornisce i risultati di maggior valore per la scienza in generale, allora può essere che la risposta sia ancora una volta un’interpretazione in termini di frequenza; questa probabilità come viene utilizzata in teorie statistiche, in particolare in meccanica statistica – il tipo di probabilità il cui logaritmo è l’entropia – è realmente un rapporto tra i numeri, di due classi, o il limite di quel rapporto. Non ci credo, ma sono disposto per ora a concedere alla teoria della frequenza che questa probabilità come utilizzata nella scienza moderna sia in realtà la stessa cosa della frequenza.

Ma, supponendo tutto ciò ammesso, rimane ancora il caso che noi abbiamo sia l’autorità del linguaggio comune sia di molti grandi pensatori per discutere sotto il titolo di probabilità quello che sembra essere piuttosto un argomento diverso, la logica della convinzione parziale. Può darsi che, come alcuni sostenitori della teoria della frequenza hanno sostenuto, la logica della convinzione parziale si troverà alla fine essere semplicemente lo studio delle frequenze, sia perché la convinzione parziale sarebbe definibile come, o per relazione, una sorta di frequenza, o perché può essere oggetto di un trattamento logico solo quando si fonda sulla frequenze sperimentali. Se queste affermazioni sono valide possono tuttavia essere stabilite solo come un risultato della nostra indagine sulla convinzione parziale, così che io propongo di ignorare la teoria della frequenza al presente e avviare un’indagine sulla logica della convinzione parziale. In questo, credo, sarà più conveniente se, invece di sviluppare da subito la mia teoria, comincio esaminando le opinioni di Keynes, che sono così ben conosciute e in sostanza così ampiamente accettate che i lettori probabilmente credono che non vi sia alcun motivo per riaprire il tema de novo fino a quando siano state demolite.

(2) LA TEORIA DI KEYNES

Keynes 1 parte dal presupposto che facciamo inferenze di probabilità per le quali asseriamo una validità oggettiva; si procede dalla convinzione piena in una proposizione alla convinzione parziale in un’altra, e noi riteniamo che questa procedura è oggettivamente giusta, in modo che se un altro uomo in circostanze simili avesse un diverso grado di convinzione, in questo sbaglierebbe. La ragione di questa ipotesi di Keynes è di supporre  che fra due qualsiasi proposizioni, date come premesse e conclusioni, esiste solo una ed una sola relazione di un determinato tipo definito relazione di probabilità;  e questo se, in qualsiasi caso dato, la relazione sia di grado α, dalla totale convinzione nelle premessa, noi possiamo, se siamo razionali, pervenire ad un grado di convinzione α nella conclusione.

Prima di criticare questo punto di vista, potrebbe forse essermi consentito di segnalare un evidente e facilmente correggibile difetto nella sua definizione. Quando viene detto che il grado della relazione di probabilità è la stessa del grado di convinzione che la giustifica, sembra essere presupposto che sia i rapporti di probabilità, da un lato, ed i gradi di convinzione, dall’altro possano essere naturalmente espressi in termini numerici e quindi che il numero che esprime o misura il rapporto di probabilità è lo stesso che esprime l’appropriato grado di convinzione. Ma se, come sostiene Keynes, queste cose non sono sempre esprimibili con i numeri, allora non possiamo porre la sua affermazione che il grado dell’una  sia lo stesso dell’altra come una semplice interpretazione, ma si deve supporre che pensi soltanto che esista una corrispondenza biunivoca tra i rapporti di probabilità e i gradi di convinzione che li giustificherebbe. Questa corrispondenza deve conservare evidentemente le relazioni di maggiore e minore, e rendere la varietà delle relazioni di probabilità e quella di gradi di convinzione simili nel senso di Russell. Penso che sia un peccato che Keynes non ha visto questo chiaramente, perché l’esattezza di questa corrispondenza avrebbe fornito materia abbastanza degna per il suo scetticismo come fece sulla misura numerica dei rapporti di probabilità. Infatti alcuni dei suoi argomenti contro la loro misura numerica sembra si applichino abbastanza altrettanto bene contro la loro esatta corrispondenza con i gradi di convinzione; per esempio, sostiene che se i tassi di assicurazione corrispondessero a soggettivi, cioè reali, gradi di convinzione, questi non sarebbero razionalmente determinati, e non potremmo dedurre che le relazioni di probabilità possano essere misurate allo stesso modo. Si potrebbe sostenere che la vera conclusione in tal caso non sarebbe che, come pensa Keynes, alla relazione non -numerica di probabilità  corrisponda un non-numerico grado di convinzione razionale, ma che i gradi di convinzione, che sarebbero sempre numerici, non hanno una corrispondenza biunivoca con le relazioni di probabilità che le giustificano. Perché è, suppongo, concepibile che i gradi di convinzione possano essere misurati da uno psicogalvanometro o qualche strumento simile, e Keynes difficilmente desidererebbe che da ciò seguirebbe che i rapporti di probabilità possano essere per derivazione misurati con le misure delle convinzioni che li giustificano.

1 J.M. Keynes, A Treatise on Probability (1921).

Ma torniamo a una critica più fondamentale delle opinioni di Keynes, che è quell’ovvietà che realmente non sembra che esistano oggetti come i rapporti di probabilità che lui descrive. Lui suppone che, comunque in alcuni casi, possano essere percepiti; ma per quanto mi riguarda mi sento fiducioso che questo non è vero. Io non li percepisco, e se devo essere convinto che esistono, deve essere fatto con ragione; inoltre ho avvedutamente il sospetto che anche gli altri non li percepiscano, perché sono in grado di raggiungere un così piccolo accordo come con quello di essi che si riferisce ad ogni due date proposizioni. Tutto quello che sembra di sapere su di questo sono alcune proposizioni generali, le leggi di addizione e moltiplicazione; è come se tutti conoscessero le leggi della geometria, ma nessuno potesse dire se ogni determinato oggetto fosse rotondo o quadrato; e trovo difficile immaginare come una massa così grande di conoscenza generale possa essere combinata con una così esigua riserva di fatti particolari. E’ vero che su alcuni casi particolari vi sia un accordo, ma questi in qualche modo, paradossalmente, sono sempre immensamente complicati; siamo tutti d’accordo che la probabilità di una moneta lanciata sia testa è 1/2, ma nessuno di noi può dire esattamente quale è la prova che costituisce l’altro termine per la relazione di probabilità intorno alla quale noi stiamo facendo valutazioni. Se, invece, prendiamo le più semplici  coppie possibili di proposizioni come ‘Questo è rosso’ e ‘Questo è blu’ o ‘Questo è rosso’ e ‘Quello è rosso’, le cui relazioni logiche dovrebbero essere le relazioni sicuramente più facili da osservare, nessuno, credo, avrebbe la presunzione di essere sicuro di quale sia la relazione di probabilità che le collega. O, forse, si può pretendere di vedere la relazione, ma non saranno in grado di dire nulla su di essa con certezza, di affermare se sia più o meno di 1/3, o così via. Essi possono, naturalmente, dire che è incomparabile con qualsiasi rapporto numerico, ma una relazione su ciò che così poco può essere detto in modo veritiero sarebbe di scarso uso scientifico e sarebbe difficile convincere uno scettico della sua esistenza. Inoltre questo punto di vista è davvero un po’ paradossale, perché ogni persona che crede nell’induzione deve ammettere che tra ‘Questo è rosso’ come conclusione e ‘Questo è rotondo’, insieme a un miliardo di proposizioni della forma ‘a è rotondo e rosso ‘come prova, c’è una relazione di probabilità finita; ed è difficile supporre che come abbiamo accumulato casi di prova questi sono improvvisamente ad un punto, ad esempio dopo 233 prove, nel quale la relazione di probabilità diventa finita e così comparabile con qualche rapporto numerico.

Mi sembra che se prendiamo le due proposizioni ‘a è rosso’, ‘b è rosso’, non possiamo discernere più di quattro semplici relazioni logiche tra di esse, vale a dire l’identità di forma, identità di predicato, la diversità del soggetto, e l’indipendenza logica di significato. Se qualcuno mi chiedesse quale probabilità darei all’una e all’altra, non dovrei cercare di rispondere meditando sulle proposizioni e cercando di discernere una relazione logica tra di esse, dovrei, piuttosto, provare ad immaginare che una di quelle sia  tutto quello che sapevo, e ad indovinare quale grado di convinzione dovrei avere poi nell’altra. Se io sono stato in grado di fare questo, potrei senza dubbio ancora non essere contento con questo, ma potrei dire ‘Questo è quello che penserei, ma, naturalmente, io sono solo un pazzo ‘e procederei a considerare ciò che un uomo saggio potrebbe pensare e chiamare questo il grado di probabilità. Io discuterò più tardi questo tipo di autocritica, quando svilupperò la mia teoria; tutto ciò che voglio sottolineare qui è che nessuno che valuta un grado di probabilità prende in considerazione semplicemente  le due proposizioni che si suppone essere correlate con esso; egli sempre considera, tra l’altro il suo proprio grado di convinzione effettivo o ipotetico. Questa osservazione mi sembra essere confermata dalla osservazione del mio comportamento; e per essere l’unico modo di rendere conto del fatto che tutti possiamo fornire stime di probabilità in casi presi dalla vita reale, ma siamo del tutto incapaci di farlo nei casi logicamente più semplici in cui, fosse la probabilità una relazione logica, sarebbe più facile da discernere.

Un altro argomento contro la teoria di Keynes può, credo, essere tratto dalla sua incapacità di aderire ad essa coerentemente anche nella discussione principi primi. C’è un passaggio nel suo capitolo sulla misura della probabilità che recita quanto segue: “La probabilità, vedi capitolo 11 (§ 12), relativa in un certo senso ai principi della ragione umana. Il grado di probabilità, che è razionale per noi prendere in considerazione, non ha la pretesa di una intuizione logica perfetta, ed è relativa in parte alle proposizioni secondarie che in realtà conosciamo; e non dipende se una visione logica più perfetta è o non è concepibile. E’ il grado di probabilità a cui conducono questi processi logici, di cui le nostre menti sono capaci; o, nel linguaggio del capitolo II, che quelle proposizioni secondarie giustificano, che in realtà conosciamo. Se non assumiamo questo punto di vista sulla probabilità, se non la limitiamo in questo modo e lo rendiamo, fino a questo punto, relativamente ai poteri umani, siamo del tutto alla deriva nell’ignoto; perché non possiamo mai sapere quale grado di probabilità sarebbe giustificato dalla percezione di relazioni logiche che noi siamo, e sempre dobbiamo essere, incapaci di comprendere.” 1

Questo passaggio mi sembra abbastanza inconciliabile con il punto di vista che Keynes adotta dappertutto tranne in questo e un altro passo simile. Perché egli sostiene in generale che il grado di convinzione che siamo giustificati nel mettere alla conclusione di un argomento è determinato da quale relazione di probabilità unisce tale conclusione alle nostre premesse. C’è un solo rapporto di questo tipo e di conseguenza una sola vera pertinente proposizione secondaria, che, ovviamente, posso o non posso conoscere, ma che è necessariamente indipendente dalla mente umana. Se noi non lo sappiamo, non lo sappiamo e non possiamo dire quanto dovremmo credere nella conclusione. Ma spesso, egli suppone, che noi lo sappiamo;  i rapporti di probabilità non sono quelli che siamo incapaci di comprendere. Ma su questo punto di vista l’argomento del passo sopra citato non ha alcun significato: le relazioni che giustificano le probabili convinzioni sono relazioni di probabilità, e non ha senso dire di loro che sono giustificate da relazioni logiche che noi siamo, e dobbiamo sempre essere, incapaci di comprendere.

Il significato del passaggio per il nostro scopo attuale sta nel fatto che esso sembra presupporre un diverso punto di vista sulla probabilità, in cui rapporti di probabilità indefinibili non giocano alcun ruolo, ma in cui il grado di convinzione razionale dipende da una varietà di relazioni logiche. Per esempio, ci potrebbe essere tra la premessa e la conclusione la relazione che la premessa era il prodotto logico di un migliaio esempi di una generalizzazione la conclusione della quale era un altro esempio, e questa relazione, che non è un rapporto di probabilità indefinibile ma definibile in termini di logica ordinaria e così facilmente riconoscibile, potrebbe giustificare un certo grado di convinzione nelle conclusioni da parte di uno che credesse nelle premesse. Dovremmo quindi avere una varietà di ordinarie relazioni logiche che giustificano lo stesso o gradi diversi di convinzione. Dire che la probabilità di a dato h era così e così significherebbe che tra a e h esiste una relazione che giustifichi tale-e-tale grado di convinzione. E da questo punto di vista sarebbe un vero e proprio punto essenziale che la relazione in questione non deve essere una relazione che la mente umana sia incapace di comprendere.

1 p. 32, corsivo nel testo.

Questo secondo punto di vista della probabilità come dipendente da relazioni logiche, ma non per sé una nuova relazione logica mi sembra più plausibile della usuale teoria di Keynes; ma questo non vuol dire che mi sento affatto propenso a concordare con lui. Questo richiederebbe  l’idea un po ‘oscura di una relazione logica che giustifica un  grado di convinzione, che non vorrei accettare come indefinibile perché non sembra essere del tutto un concetto chiaro e semplice. Inoltre è difficile dire quali relazioni logiche giustificano quali gradi di convinzione, e perché; qualsiasi decisione in questo senso sarebbe arbitraria, e porterebbe ad una logica di probabilità costituita da una moltitudine di cosiddetti “necessari” fatti, come la logica formale secondo il punto di vita di  Chadwick sulle constanti logiche. 1 Al contrario io penso sia molto meglio cercare una spiegazione di questa ‘necessità sul modello di lavoro di Wittgenstein, che ci permette di vedere chiaramente in quale preciso senso e perché le proposizioni logiche sono necessarie, e in maniera generale perché il sistema della logica formale è composto di  proposizioni di cui è composto, e quale è la sua caratteristica comune. Come la scienza naturale cerca di spiegare e calcolare i fatti della natura, così la filosofia dovrebbe cercare, in un certo senso, di spiegare e calcolare i fatti di logica; un compito ignorato dalla filosofia che respinge questi fatti come non calcolabili e in un senso indefinibile ‘necessari’.

Qui mi propongo di concludere questa critica della teoria di Keynes, non perché non ci siano altri aspetti nei quali sembra offrire il fianco ad obiezioni, ma perché spero che quello che ho già detto sia sufficiente a dimostrare che non è così del tutto soddisfacente da rendere inutile qualsiasi tentativo di trattare la teoria da un punto di vista piuttosto diverso.

J.A. Chadwick “Logical Constants”, Mind, 1927.

(3) GRADI DI CONVINZIONE

L’oggetto della nostra indagine è la logica della convinzione parziale, e non credo che possiamo affrontarla a meno che abbiamo almeno una nozione approssimativa di ciò che sia la convinzione parziale, e come, se non altro, può essere misurata. Non sarà molto illuminante sentirsi dire che in certe circostanze sarebbe razionale credere una proposizione nella misura di 2/3, a meno che sappiamo che cosa significa questo tipo di convinzione in ciò. Dobbiamo quindi cercare di sviluppare un metodo puramente psicologico della misura della convinzione. Non è abbastanza misurare la probabilità; al fine di assegnare correttamente la nostra convinzione alla probabilità dobbiamo anche essere in grado di misurare la nostra convinzione. E’ comune opinione che la convinzione e altre variabili psicologiche non siano misurabili, e se questo fosse vero la nostra indagine sarebbe vana;  e così sarebbe tutta la teoria della probabilità concepita come la logica della parziale convinzione; perché se la frase ‘una convinzione di due terzi di certezza’ fosse priva di significato, un calcolo il cui unico obiettivo sia imporre tali convinzioni sarebbe anche privo di senso. Quindi a meno che non siamo disposti a rinunciare a tutta la faccenda come un cattivo lavoro noi siamo tenuti a sostenere che le convinzioni possono in qualche misura essere misurate. Se dovessimo seguire l’analogia di Keynes nel trattare le probabilità dovremmo dire che alcune convinzioni sarebbero misurabili e altre no; ma questa probabilmente non mi sembra essere un considerazione corretta della questione: non vedo come si possa dividere nettamente le convinzioni in quelle che hanno una posizione nella scala numerica e quelli che non l’hanno. Ma penso che le convinzioni si differenziano in misurabilità nei seguenti due modi. In primo luogo, alcune convinzioni  possono essere misurate più accuratamente di altre; e, in secondo luogo, la misurazione delle convinzioni è abbastanza certamente un processo ambiguo che conduce ad una risposta variabile a seconda di come esattamente la misurazione viene effettuata. Il grado di convinzione a questo proposito è come l’intervallo di tempo tra due eventi; prima di Einstein si considerava che tutti i metodi ordinari di misura di un intervallo di tempo avrebbero dovuto portare allo stesso risultato se effettuata correttamente. 1  Einstein ha dimostrato che questo non era il caso; e l’intervallo di tempo non può più essere considerato come una nozione precisa, ma deve essere abbandonato in tutte le indagini precise. Tuttavia, l’intervallo di tempo e il sistema newtoniano sono sufficientemente accurati per molti scopi e più  facili da applicare. Cercherò di argomentare in seguito che il grado di una convinzione è come un intervallo di tempo; non ha un preciso significato a meno che si specifichi più precisamente come debba essere misurato. Ma per molti scopi possiamo supporre che i modi alternativi di misurarlo portano allo stesso risultato, anche se questo è solo approssimativamente vero. Le discrepanze risultanti sono più evidenti in connessione con alcune convinzioni che con altre, e queste dunque appaiono meno misurabili. Entrambi questi tipi di carenze nella misurabilità, dovuti rispettivamente alla difficoltà di ottenere una misura sufficientemente esatta e ad una importante ambiguità nella definizione del processo di misura, si verificano anche nella fisica e così non sono difficoltà peculiari del nostro problema; quello che è peculiare è che è difficile formulare qualsiasi idea di come la misurazione debba essere effettuata, come l’unità di misura si debba ricavare, e così via. Consideriamo quindi ciò che è implicito nella misurazione delle convinzioni. Un sistema soddisfacente deve in primo luogo assegnare ad ogni convinzione una grandezza o misura avente una precisa posizione in un ordine di grandezza; convinzioni che siano dello stesso grado di convinzione devono  avere la stessa misura dell’una e dell’altra, e così via. Naturalmente questo non può essere realizzato senza introdurre una certa quantità di ipotesi o invenzioni. Anche in fisica non si può sostenere che oggetti che sono uguali a qualche cosa siano uguali l’uno all’altro senza porre ‘uguale’ non con il significato ‘percettibilmente uguale’, ma come un’invenzione o una relazione ipotetica. Non voglio discutere la metafisica o epistemologia di questo processo, ma solo  sottolineare che se è ammissibile in fisica, sarà anche ammissibile in psicologia. La semplicità logica caratteristica delle relazioni trattate in una scienza non viene ottenuta per sua sola natura senza alcuna mescolanza con l’invenzione. Ma il costruire una tale serie ordinata di gradi non è tutto l’insieme del nostro lavoro; dobbiamo anche assegnare valori numerici a questi gradi in qualche modo intelligibile. Ovviamente possiamo facilmente spiegare che indichiamo piena convinzione con 1, la convinzione piena nell’opposto con 0, e le uguali convinzioni in una proposizione e la sua contraddizione con 1/2. Ma non è così semplice dire cosa si intende con una convinzione di certezza pari a 2/3, o che una convinzione in una proposizione sia due volte più forte che la sua contraddizione. Questa è la parte più difficile del lavoro, ma è assolutamente necessaria; perché noi calcoliamo le probabilità numeriche, e se queste corrispondono al grado di convinzione noi dobbiamo scoprire qualche modo definito di assegnare numeri ai gradi di convinzione. In fisica spesso si attribuiscono i numeri scoprendo un processo fisico di addizione 1: il numero per la misura di lunghezze non viene assegnato arbitrariamente soggetto soltanto alla condizione che una maggiore lunghezza deve avere una misura più grande; noi la determiniamo ulteriormente stabilendo un significato fisico per l’addizione; la lunghezza ottenuta mettendo insieme due date lunghezze deve avere per la sua misura la somma delle singole misure. Un sistema di misura in cui non vi è nulla che corrisponde a questo viene immediatamente riconosciuto come arbitrario, per esempio la scala di durezza 1 di Mohs in cui 10 è assegnato arbitrariamente al diamante, il materiale più duro conosciuto, 9 al successivo più duro, e così via.

1 Vedi N. Campbell, Physics The Elements (1920), p.277.

1 Ibid., p.271.

Dobbiamo quindi trovare un processo di addizione per i gradi di convinzione, o un qualche  sostituto a questo che sia ugualmente adeguato a definire una scala numerica. Questo è il nostro problema: come si risolve? Ci sono, credo, due modi da cui possiamo iniziare. Possiamo, in primo luogo, supporre che il grado di una convinzione sia qualcosa di percepibile da chi lo possiede; ad esempio che le convinzioni differiscano nell’intensità della sensazione da cui sono accompagnate, che potrebbe essere chiamata un sentimento di convinzione o sensazione di convincimento, e che per grado di convinzione intendiamo l’intensità di questo sentimento. Questo punto di vista sarebbe molto scomodo, perché non è facile attribuire numeri all’intensità dei sentimenti; ma a parte questo mi sembra palesemente falso, perché le convinzioni che abbiamo più fortemente sono spesso accompagnate praticamente affatto da nessuna sensazione;  nessuno sente fortemente cose che dà per scontate. Siamo quindi condotti alla seconda ipotesi che il grado di una convinzione sia una proprietà causale di ciò, che possiamo esprimere vagamente come il campo di applicazione in cui siamo pronti ad agire con esso. Questa è una generalizzazione del noto punto di vista, che la differenza di convinzione sta nella sua efficacia causale, che viene discusso da Russell nella sua Analysis of Mind. Egli in quell’opera la respinge per due motivi, uno dei quali sembra completamente mancare il punto. Egli sostiene che nel corso della serie dei pensieri, noi concepiamo molte cose che non danno luogo ad azione. Questa obiezione, tuttavia, è vicina a cogliere nel segno, in quanto non si afferma che una convinzione sia un’idea che effettivamente porta ad una azione, ma che porterebbe all’azione in opportune circostanze; proprio come una zolletta di arsenico è detta velenosa, non perché in realtà ha ucciso o ucciderà qualcuno, ma perché potrebbe uccidere chiunque la mangiasse. Il secondo argomento di Russell, tuttavia, è più arduo. Egli fa notare che non è possibile supporre che le convinzioni differiscano dalle altre idee solo per i loro effetti, perché altrimenti se fossero identiche anche i loro effetti sarebbero identici. Questo è perfettamente vero, ma può ancora restare il caso che la natura della differenza tra le cause sia o completamente sconosciuta o molto vagamente nota, e che quello di cui vogliamo parlare sia la differenza tra gli effetti, che è immediatamente osservabile e rilevante. Non appena noi consideriamo una convinzione quantitativamente, questo mi sembra l’unico punto di vista che possiamo avere su di essa. Si potrebbe giustamente considerare che la differenza tra credere e non credere stia nella presenza o assenza di sentimenti introspettivamente. Ma quando cerchiamo di conoscere quale sia la differenza tra credere con più certezza e credere con meno certezza, non possiamo più considerarlo come definibile nell’avere più o meno di una certa sensazione osservabile; almeno io personalmente non sono in grado di riconoscere sentimenti di questo genere. Mi sembra che la differenza si trovi in fino a che punto dovremmo agire in base a queste convinzioni: questo può dipendere dal grado di qualche sensazione o sensazioni, ma non so esattamente quali sensazioni e non penso che sia indispensabile che le conosciamo. Proprio la stessa cosa si trova nella fisica; si è trovato che un cavo che collega lastre di zinco e rame poste in un acido devia un ago magnetico posto nelle sue vicinanze. Di conseguenza, se l’ago viene più o meno deviato si dice che il filo elettrico porta una corrente più o meno grande. La natura di questa ‘corrente’ può essere solo ipotizzata: quello che viene osservato e misurato sono semplicemente i suoi effetti. Si può senza dubbio obiettare che noi sappiamo con quanta forza crediamo in oggetti, e che possiamo conoscere questo solo se siamo in grado di misurare la nostra convinzione per introspezione. Questo non mi sembra necessariamente vero;  in molti casi, credo, il nostro giudizio sulla forza della nostra convinzione è realmente su come agiremmo in ipotetiche circostanze. Si potrebbe rispondere che possiamo solo dire come agiremmo osservando l’attuale sensazione di convincimento che determina il modo in cui agiremmo; ma ancora una volta dubito la cogenza dell’argomento. E’  possibile che ciò che determina il modo in cui agiremmo ci determina anche, direttamente o indirettamente ad avere una corretta opinione su come agiremmo,  senza che ciò mai giunga nella consapevolezza. Supponiamo, tuttavia, che mi sbagli su questo e che possiamo decidere per introspezione la natura della convinzione, e misurarne il grado; pertanto, io sosterrei, il tipo di misura di convinzione con cui la probabilità è interessata non è di questo tipo, ma è una misura della convinzioni su qualche base di azione. Questo io penso si possa mostrare in due modi. In primo luogo, considerando la scala di probabilità tra 0 e 1, e il tipo di modo di usarlo, vedremo che è molto appropriato per la misura della convinzione come base di un’azione, ma in nessun modo correlato alla misura di una introspettiva sensazione. Perché le unità nei termini in cui  sono misurate tali sensazioni o sentimenti sono sempre, penso, differenze che sono appena percettibili: non c’è altro modo di ottenere tali unità. Ma non vedo alcuna ragione per supporre che l’intervallo tra una convinzione di grado 1/3 e una di grado 1/2 sia composto da alquante appena percettibili modifiche così come quella tra una di 2/3 ed una di 5/8, o che questa scala basata su appena percettibili differenze non avrebbe alcuna semplice relazione con la teoria della probabilità. D’altra parte la probabilità di 1/3 è chiaramente correlata al tipo di convinzione che porterebbe ad una scommessa di 2 a 1, e verrà illustrato di seguito come generalizzare questo rapporto in modo da applicarlo ad una azione in generale. In secondo luogo, gli aspetti quantitativi di convinzioni come base di azione sono evidentemente più importanti dell’intensità di una sensazione di convinzione. Questi ultimi sono senza dubbio interessanti, ma possono essere molto variabile da individuo a individuo, e il loro interesse pratico è interamente dovuto alla loro posizione di ipotetiche cause di convinzione per qualche fondamento di una azione. E’ possibile che qualcuno dirà che la misura in cui dovremmo agire sulla base di una convinzione in opportune circostanze è un oggetto ipotetico, e quindi non soggetto a misurazione. Ma dire questo è solo il rivelare l’ignoranza delle scienze fisiche che costantemente si occupano di misurare quantitativi ipotetici; per esempio, l’intensità elettrica in un dato punto è la forza che agirebbe su una carica unitaria se fosse messa in un dato luogo. Cerchiamo ora di trovare un metodo di misurare le convinzioni come fondamento di azioni possibili. E’ chiaro che noi siamo interessati all’intenzione piuttosto che alle convinzioni realizzate; vale a dire, non con le convinzioni al momento in cui pensiamo ad esse, ma alle mie convinzioni come la mia convinzione che la terra è rotonda, a cui raramente penso, ma che guiderebbe la mia azione in ogni caso in cui fosse rilevante. Il vecchio consolidato modo di misurare la convinzione di una persona è quello di proporre una scommessa, e vedere quale sarebbe la più bassa posta che egli accetterebbe. Considero questo metodo fondamentalmente valido, ma ha il difetto di non essere abbastanza generale, e di essere necessariamente inesatto. E’ inesatto parzialmente  a causa del decrescere dell’utilità marginale del denaro, in parte perché una persona può avere entusiasmo o riluttanza a scommettere, perché o gode o detesta questa emozione o per qualsiasi altro motivo, ad esempio, per scrivere un libro. La difficoltà è simile a quella di separare due differenti forze co-operanti. Inoltre, la proposta di una scommessa può alterare inevitabilmente lo stato della sua opinione; così come non potremmo sempre misurare l’intensità elettrica con una effettiva introduzione di una carica elettrica e osservando a quale forza essa è soggetta, perché l’introduzione di una carica cambia la distribuzione che si vuole misurare. Al fine quindi di costruire una teoria quantitativa della convinzione che sarebbe insieme generale ed più esatta, mi propongo di prendere come fondamento una teoria psicologica generale, che è ormai universalmente abbandonata, ma risulta comunque, credo, abbastanza vicina alla verità in una sorta di casi in cui noi siamo più interessati. Mi riferisco alla teoria che noi agiamo nel modo che pensiamo che più probabilmente realizzi gli oggetti del nostro desiderio, in modo che le azioni di una persona sono completamente determinate dai suoi desideri e dalle sue opinioni. Questa teoria non può risultare adeguata a tutti i fatti, ma mi sembra una utile approssimazione alla verità, soprattutto nel caso della nostra vita cosciente o professionale, ed è implicata in grande accordo con il nostro pensiero. Si tratta di una teoria semplice e una teoria che molti psicologi ovviamente gradirebbero mantenere attraverso l’introduzione di desideri inconsci e opinioni inconsce in al fine di renderla più in armonia con i fatti. Non mi sento di giudicare fino a che punto tali ipotesi possano ottenere i risultati richiesti: io solo l’affermo per ciò che segue da una verità approssimativa, o la verità in relazione a questo sistema artificiale di psicologia, che, come la meccanica newtoniana può, io credo, ancora essere utilizzata con profitto anche se è noto per essere errata. Si deve rilevare che questa teoria non deve essere identificata con la psicologia degli Utilitaristi, in cui il piacere ha una posizione dominante. La teoria che propongo di adottare è che cerchiamo le cose che vogliamo, che possono essere per nostro o di altrui piacere, o una qualsiasi altra cosa, e le nostre azioni si verificano per come riteniamo più probabile ottenere questi beni. Ma questa non è una precisa formulazione, perché una precisa formulazione della teoria può essere fatta solo dopo aver introdotto la nozione quantitativa di convinzione. Chiamiamo le cose che una persona desidera in definitiva, ‘beni’, e assumiamo in un primo momento che siano numericamente misurabili e additivi. Vale a dire che se lui preferisce di per sé un’ora di nuoto ad un’ora di lettura, egli preferirà due ore di nuoto a un’ora di nuoto e ad un’ora di lettura. Questo è ovviamente assurdo nel caso specifico, ma questo potrebbe essere solo perché il nuoto e la lettura non sono beni fondamentali, e perché non possiamo immaginare una seconda ora di nuoto esattamente simile alla prima, a causa dell’affaticamento, ecc. Cominciamo col supporre che il nostro soggetto non ha dubbi su nulla, ma sicure opinioni su tutte le proposizioni. Allora possiamo dire che sempre sceglierà il corso di azioni che porteranno secondo la sua opinione alla massima somma di bene. Va sottolineato che in questo esempio bene e male non sono da intendersi in nessun senso etico, ma semplicemente per indicare quello per cui una persona prova desiderio o avversione. Il problema quindi si pone su come dobbiamo modificare questo semplice sistema per tener conto dei diversi gradi di certezza nelle sue convinzioni. Suggerisco che si introduca come legge psicologica che il suo comportamento sia governato da quello che viene chiamato la speranza matematica; vale a dire che, se p è una proposizione su cui egli ha dubbi, ogni bene o male per la cui realizzazione p è a suo avviso una condizione necessaria e sufficiente entrerà nei suoi calcoli moltiplicata per quella frazione, che verrebbe chiamata il ‘grado della sua convinzione in p’. Definiamo così il grado di convinzione in un modo che presuppone l’uso della speranza matematica. Questo si può porre in un modo diverso. Supponiamo che il suo grado di convinzione in p sia m/n; allora la sua azione sarebbe tale come se egli dovesse scegliere di ripeterla esattamente n volte, in m volte delle quali p sarebbe vera, e nelle altre falsa. [Qui sarebbe necessario supporre che in ciascuna delle n volte egli non abbia memoria delle precedenti.] Questo può anche essere preso come una definizione del grado di convinzione, e può essere facilmente considerato come equivalente alla definizione precedente. Diamo un esempio del tipo di casi che potrebbero verificarsi. Io sono ad un bivio e non conosco la strada, ma io piuttosto penso che una delle due strade è quella giusta. Propongo quindi di andare in quella direzione, ma tengo gli occhi aperti per qualcuno a cui chiedere; se adesso vedo qualcuno a mezzo miglio di distanza oltre i campi, se devio per chiedere a lui dipenderà dal relativo disagio di andare fuori dalla mia strada per attraversare i campi o di proseguire sulla strada sbagliata se si tratta della strada sbagliata. Ma dipenderà anche da come sono sicuro che ho ragione; e chiaramente più Io sono sicuro di questo minore sarà la distanza che sarei disposto a percorrere dalla strada (in cui mi trovo) per controllare la mia opinione. Propongo pertanto di utilizzare la distanza che sarei disposto a percorrere per chiedere, come misura della fiducia nella mia opinione; e quello che ho detto sopra spiega come questo deve essere fatto. Possiamo iniziare come segue: supponiamo che l’inconveniente di percorrere x iarde per chiedere sia f(x), il vantaggio  di arrivare alla destinazione giusta sia r, quello di arrivare a quella sbagliata w. Quindi se proprio fossi disposto ad andare ad una distanza d per chiedere, il grado della mia convinzione che io sono sulla strada giusta sarebbe data da

Schermata 2013-12-27 alle 18.29.37

 

 

 

Per una tale azione ci sarebbe uno che mi pagherebbe per farla, se avessi dovuto agire nello stesso modo n volte, in np delle quali ero sulla strada giusta mentre nelle altre no.

Per il bene totale risultante dal non chiedere ogni volta

= npr + n(1-p) w

= nw + np (r – w)

che risulta dal chiedere ad una distanza x ogni volta = nr- nf(x) [io so che vado sempre nella strada giusta]

Questo è più grande dell’espressione precedente, a condizione che

f (x) <(r – w) (1-p),

∴ la distanza critica d è collegata con p, il grado di convinzione, con la relazione f (d) = (r – w) (1-p) o

Schermata 2013-12-27 alle 18.29.37

come affermato sopra.

 

 

E’ facile vedere che questo modo di misurare la convinzione, fornisce risultati in accordo con i concetti ordinari; comunque per estensione la piena convinzione è indicata con 1, piena convinzione in negativo con 0, e pari convinzione tra due con 1/2. Inoltre, ammette la validità della scommessa come mezzo per misurare le convinzioni. Proponendo una scommessa su p diamo al soggetto una possibile condotta di azione da cui risulterebbe tanto supplementare bene per lui se p fosse vero e tanto maggiore male se p è falso. Supponendo la scommessa fosse tra bene e male invece che in denaro, egli scommetterebbe per qualsiasi migliore probabilità di quella che corrisponde al suo stato di convinzione; in realtà il suo stato di convinzione è misurato dalla probabilità che egli precisamente assumerà; ma questo è viziato, come già spiegato, per amore o odio di emozione, e per il fatto che la scommessa è in denaro e non in bene e male. Poiché è universalmente riconosciuto che il denaro ha un’utilità marginale decrescente, se si considerano le scommesse in denaro, è evidente che esse devono essere per quanto possibile di piccola posta. Ma poi di nuovo la misura è guastata introducendo il nuovo fattore di riluttanza a preoccuparsi per inezie.

Vediamo ora di scartare l’ipotesi che il bene sia additivo e immediatamente misurabile, e cerchiamo di elaborare un sistema con meno ipotesi possibili. Per cominciare supponiamo, come prima, che il nostro soggetto ha certe convinzioni su tutto; poi egli agirà in modo che ciò che crede essere le conseguenze complessive della sua azione siano le migliore possibili. Se poi avessimo il potere  dell’Onnipotente, e potessimo convincere il nostro soggetto del nostro potere, potremmo, offrendogli opzioni, scoprire come ha posto in ordine di merito tutti i possibili andamenti del mondo. In questo modo tutti i mondi possibili verrebbero posti in ordine di valore, ma non avremmo un modo esatto di rappresentarli con i numeri. Non avrebbe alcun significato l’affermazione che la differenza di valore tra α e β sia pari a quella tra γ e δ. [Qui e altrove usiamo lettere greche per rappresentare le diverse possibili totalità di eventi tra cui il nostro soggetto sceglie – le definitive organiche unità.]

Supponiamo ora che il soggetto sia in grado di dubitare; allora potremmo provare il suo grado di convinzione in diverse proposizioni facendogli offerte del tipo seguente. Preferiresti avere un mondo α in qualsiasi evento; o un mondo β se p è vero, e un mondo γ se p è falsa? Se, allora, egli fosse certo che che p fosse vero, egli semplicemente confronterebbe α e β e sceglierebbe tra questi come se non ci fossero condizioni fissate; ma se dubitasse della sua scelta non potrebbe decidere in modo così semplice. Propongo di stabilire assiomi e definizioni in merito ai principi che regolano scelte di questo tipo. Questo è, naturalmente, una versione molto schematica della situazione nella vita reale, ma è, credo, più facile da prendere in considerazione in questa forma.

Vi è innanzitutto una difficoltà che deve essere affrontata; le proposizioni p, come nel caso di cui sopra che vengono utilizzate come condizioni nelle varianti offerte possono essere tali che la loro verità o falsità è un oggetto del desiderio per il soggetto. Questo scoprirà che complica il problema, e noi dovremo assumere che ci sono proposizioni per le quali questo non è il caso, che noi chiameremo eticamente neutrali. Più precisamente una proposizione atomica p è detta eticamente neutrale se due mondi possibili che differiscono solo in relazione alla verità di p sono sempre di pari valore; e una proposizione non-atomica p è detta eticamente neutrale se tutti suoi argomenti veri 1 sono eticamente neutrali. 1 Assumo qui la teoria delle proposizioni di Wittgenstein; può essere possibile dare una definizione equivalente nei termini di qualsiasi altra teoria.

Cominciamo con la definizione del grado di convinzione 1/2 in una proposizione eticamente neutrale. Si dice che il soggetto ha un grado di convinzione 1/2 in una certa proposizione p se non ha preferenze tra le opzioni (1), α se p è vero, β se p è falsa, e (2) α se p è falsa, β se p è vera, ma ha semplicemente una preferenza tra α e β. Supponiamo per un assioma che se questo è vero per qualche coppia α, β è vero per tutte le coppie tali. 1 Ciò risulta rozzamente definendo il grado di convinzione 1/2 come quel grado di convinzione che porta all’indifferenza fra lo scommettere in un modo e scommettere nell’altro per la stessa puntata.

Il grado di convinzione 1/2 così definito può essere usato per misurare i valori numericamente nel modo seguente. Dobbiamo spiegare cosa si intende per la differenza di valore tra α e β essere uguale a quello tra γ e δ; e definiamo questo per indicare che, se p è una proposizione eticamente neutrale creduta con il grado 1/2, il soggetto non ha alcuna preferenza tra le opzioni (1) α se p è vera, δ se p è falsa, e (2) β se p è vera, γ se p è falsa.

Questa definizione può costituire la base di un sistema di misurazione dei valori nel modo seguente: –

Chiamiamo qualsiasi insieme di tutti i mondi ugualmente preferibile a un mondo dato un valore: supponiamo che, se il mondo α è preferibile a β qualsiasi mondo con lo stesso valore di α è preferibile a qualsiasi mondo con lo stesso valore di β e possiamo dire che il valore di α è maggiore di quella di β. Questa relazione ‘maggiore di’ ordina i valori in una serie. Useremo α d’ora in poi sia per il mondo sia per suo valore.

Assiomi.

(1) Vi è una proposizione p eticamente neutrale creduta con grado 1/2.

(2) Se p, q sono proposizioni cosiffatte anche l’opzione

α se p, δ se non-p è equivalente a β se p, γ se non-p

allora α se q, δ se non-q è equivalente a β se q, γ se non-q.

Definizione Nel caso di cui sopra si dice αβ = γδ.

Teoremi.  Se αβ=γδ

allora βα=δγ, αγ=βδ, γα=δβ

1 α e β si suppongono così indefinite da essere compatibili sia con p sia con non-p.

(2a) Se αβ = γδ, allora α> β è equivalente a γ> δ

e α = β è equivalente a γ = δ

(3) Se l’opzione A è equivalente all’opzione B e B a C, allora A è equivalente a C.

Teorema. Se αβ = γδ e βη = ζγ

allora  αη = ζδ

(4) Se αβ = γδ, γδ = ηζ, allora  αβ = ηζ.

(5) (α, β, γ). E ! (ικ) (ακ = βγ)

(6) (α, β). E ! (ικ) (ακ = κβ)

(7) Assioma di continuità: – Qualsiasi progressione ha un limite (ordinale).

(8) Assioma di Archimede.

Questi assiomi consentono ai valori di essere correlati biunivocamente con numeri reali in modo che se α1 corrisponde a α, ecc

αβ = γδ . ≣ . α1 – β1 = γ1 – δ1.

D’ora in poi useremo α anche per il correlato numero reale α1.

Avendo così definito un metodo di misurazione del valore possiamo ricavare un modo per misurare la convinzione in generale. Se l’opzione di α certa è indifferente con quella di β, se p è vero e γ se p è falso 1, possiamo definire il grado di convinzione del soggetto in p come il rapporto della differenza tra α e γ sulla differenza tra β e γ; che si deve supporre uguale per tutte le α, β e γ che soddisfano le condizioni. Questo valore grossolanamente per definire il grado di convinzione in p per la probabilità per cui il soggetto scommetterebbe su p, essendo la scommessa gestita nei termini di differenza di valori come definiti. La definizione si applica solo alla convinzione parziale e non include certe convinzioni; perché la convinzione di grado 1 in p, α per certo è indifferente rispetto ad α se p e per ogni β  se non-p.

Qui β deve comprendere la verità di p, γ la sua falsità; p non deve più essere eticamente neutrale. Ma dobbiamo assumere che esiste un mondo con qualsiasi valore assegnato in cui p è vero, e uno in cui p è falso.

Siamo anche in grado di definire una nuova idea molto utile – il ‘grado di convinzione in p dato q’. Questo non significa il grado di convinzione in ‘Se p allora q’, o quello in ‘p implica q’, o quella che il soggetto avrebbe in p se conoscesse q, o quella che dovrebbe avere. Esprime approssimativamente le probabilità per cui egli scommetterebbe ora su p, la scommessa sarebbe valida solo se q fosse vero. Tali scommesse condizionali venivano spesso fatte nel XVIII secolo.

Il grado di convinzione in p dato q si misura così. Supponiamo che un soggetto indifferente tra le opzioni (1) α se q vero, β se q falsa, (2) γ se p vera e q vero, δ se p falsa e q vero, β se q falso. Allora il suo grado di convinzione in p dato q è il rapporto delle differenza tra α e δ sulla differenza tra γ e δ, che dobbiamo supporre le stesse per qualsiasi, α, β, γ, δ che soddisfino le condizioni date. Questa non è la stessa cosa del grado con cui potrebbe credere in p, se credesse certo q; perché la conoscenza di q potrebbe per ragioni psicologiche alterare completamente il suo intero sistema di convincimento.

Ognuna delle nostre definizioni è stata accompagnata da un assioma di coerenza, e nella misura in cui ciò è falso, la nozione di grado di convinzione diviene non più valido. Questo ha una certa analogia con la situazione in materia di simultaneità discussa sopra.

Non ho sviluppato la logica matematica di questo nel dettaglio, perché questo, credo, sarebbe come avere un risultato con sette decimali che è valido con due soli decimali. La mia logica non può essere considerata come in grado di dare più di un di un certo tipo di procedimento che potrebbe funzionare.

Da queste definizioni e assiomi è possibile provare le leggi fondamentali della convinzione probabile (i gradi di convinzione sono compresi tra 0 e 1):

(1) Grado di convinzione in grado p + di convinzione in  Schermata 2013-11-24 alle 21.04.13    = 1

(2) Grado di convinzione in p  dato q + grado di convinzione in  Schermata 2013-11-24 alle 21.04.13  dato q = 1.

(3) Grado di credere in (p e q) = grado di convinzione in p x grado di convinzione in q dato p.

(4) Grado di convinzione in (p e q) + grado di convinzione in (p e Schermata 2013-08-23 alle 22.32.01   ) = grado di convinzione in p.

Le prime due sono di immediata comprensione. La (3) si dimostra come segue.

Sia il grado di convinzione in p = x, quello in q dato p = y.

Allora ξ certo ≣ ξ + (1-x) t se p vero, ξ – xt se p falso per qualsiasi t.

ξ + (1 – x) t se p vero ≣

ξ + (1 – x) + t (1 – y) u se ‘p e q’ veri,

ξ + (1 – x) t – yu se p vero e q falso;  per ogni u

Scegliamo u in modo che ξ + (1 – x) t – yu = ξ – xt,

cioè sia u = t / y (y ≠ 0)

Allora ξ certo ≣

ξ+ (1 – x)t + t (1 – y) t / y se p e q veri,

ξ – xt altrimenti.

∴ il grado di convinzione in ‘p e q’ =  Schermata 2013-12-28 alle 09.25.12        = xy. (t≠0)

Se y = 0, comporta t = 0.

Allora ξ certo ≣ ξ se p vero, ξ se p falso

≣ ξ + u se p vero, q vero;  ξ se p falso, q falso; ξ se p falso

≣ ξ+u, pq vero;  ξ, pq falsa

∴ grado di convinzione in pq = 0.

(4) segue da (2), (3) come segue: –

Grado di convinzione in pq = p x  quello in q dato p, dalla (3).

Allo stesso modo il grado di convinzione in p Schermata 2013-08-23 alle 22.32.01    = quello in p x quello in Schermata 2013-08-23 alle 22.32.01     dato p

∴ la  somma = grado di convinzione in p, per la (2).

Queste sono le leggi della probabilità, che abbiamo dimostrato di essere necessariamente vere per ogni insieme coerente di gradi di convinzione. Qualsiasi insieme definito di gradi di convinzione che le infrange sarebbe incoerente nel senso che ha violato le leggi di preferenza tra le opzioni, come quella che la preferenza è una relazione asimmetrica transitiva, e che se α è preferibile a β, β di certo non può essere preferibile ad α se p, β se non-p. Se la condizione mentale di chiunque viola queste leggi, la sua scelta dipenderebbe dalla forma precisa cui le opzioni gli sono state offerte, il che sarebbe assurdo. Potrebbe assumere una scommessa fatta contro di lui con la migliore astuzia e restare a perdere in ogni caso.

Troviamo, quindi, che un calcolo preciso della natura della convinzione parziale rivela che le leggi della probabilità sono leggi di coerenza, un’estensione alle convinzioni parziali della logica formale, la logica della coerenza. Esse non dipendono per il loro significato da qualsiasi grado di convinzione in una proposizione che risulti essere univocamente determinata come una proposizione razionale: ma semplicemente distinguono gli insiemi di convinzioni che vi obbediscono come quelle coerenti. Avere un qualsiasi grado definito di convinzione implica un certo grado di coerenza, vale a dire la volontà di scommettere su una proposizione data con la stessa probabilità per ogni puntata, essendo la puntata misurata in termini di valori massimi.

Avere gradi di convinzione che obbediscono alle leggi della probabilità implica un’ulteriore misura di coerenza, vale a dire una tale coerenza tra le probabilità accettabili su diverse proposizioni da impedire a una scommessa fatta contro di voi.

Alcune considerazioni conclusive su questa sezione non sarebbero fuori luogo. In primo luogo, queste considerazioni si basano fondamentalmente sulle scommesse, ma questo non sembra irragionevole quando si si sia considerato che in tutta la nostra vite stiamo un certo senso scommettendo. Ogni volta che andiamo alla stazione stiamo scommettendo che un treno effettivamente camminerà, e se non avessimo un sufficiente grado di fiducia in questo rifiuteremmo la scommessa e rimarremmo a casa. Le opzioni che Dio ci da’ sono sempre subordinate al nostro indovinare se una certa proposizione è vera. In secondo luogo, si basa tutto sul concetto di speranza matematica; l’insoddisfazione spesso sentita con questa idea è dovuta principalmente alla misura imprecisa del bene. Chiaramente le aspettative matematiche in termini di denaro non sono adatte guide per il comportamento. Va ricordato, nel giudicare il mio sistema, che in esso un valore viene effettivamente definito mediante la speranza matematica in caso di convinzione di grado 1/2, e così possiamo attenderci che possa essere rappresentato adeguatamente in una scala per una utile applicazione della speranza matematica nel caso di altri gradi di convinzione.

In terzo luogo, nulla è stato detto sui gradi di convinzione quando il numero di alternative è infinito. A proposito di questo non ho niente di utile da dire, tranne che dubito che la mente sia capace di contemplare più di un numero finito di alternative. Si possono prendere in considerazione domande alle quali sia possibile un numero infinito di risposte, ma al fine di esaminare le risposte si devono riunire in un numero finito di gruppi. La difficoltà diventa praticamente rilevante quando si parla di induzione, ma anche allora mi sembra non ci sia necessità di introdurla. Possiamo discutere se l’esperienza passata fornisce un elevata probabilità al levarsi del sole domani senza preoccuparsi di quale probabilità ciò dia al sole di alzarsi ogni mattina per sempre. Per questo motivo non posso ma non intendo che la discussione del problema 1 di Ritchie sia insoddisfacente; è vero che possiamo convenire che le generalizzazioni per induzione  non richiedono nessuna probabilità finita, ma aspettative particolari intrattenute su basi induttive senza dubbio hanno una elevata probabilità numerica nelle menti di tutti noi. Siamo tutti più certi che il sole sorgerà  domani che non avrò 12 con due dadi al primo tiro, ovvero abbiamo una convinzione di grado più elevato di 35/36 in quel caso. Se mai l’induzione richiedesse una giustificazione logica  questa è in rapporto con la probabilità di un evento come questo.

1 A.D. Ritchie, “Induction and Probability”. Mind, 1926. p. 318. ‘La conclusione della discussione precedente può essere messa in modo semplice. Se il problema dell’induzione fosse posto come “Come le generalizzazioni induttive possono acquisire una grande probabilità numerica? ” allora questo è uno pseudo-problema, perché la risposta è “non possono”. Questa risposta, tuttavia,  non è una negazione della validità dell’induzione, ma è una diretta conseguenza della natura della probabilità. Lascia ancora intatto il vero problema dell’induzione che è “Come può essere aumentata la probabilità di una induzione? ” e lascia in piedi l’intera discussione di Keynes su questo punto.’

(4) LA LOGICA DELLA COERENZA

Possiamo essere d’accordo che in un certo senso sia compito della logica di dirci che cosa dobbiamo pensare; ma l’interpretazione di questa affermazione solleva notevoli difficoltà. Si può dire che dobbiamo pensare ciò che è vero, ma in questo senso ci viene detto cosa pensare da tutta la scienza e non semplicemente dalla logica. Né, in questo senso, può essere basata alcuna giustificazione per la convinzione parziale; la cosa migliore idealmente è che avremmo convinzioni di grado 1 in tutte le proposizioni vere e convinzioni di grado 0 in tutte le proposizioni false. Ma questo è un criterio troppo elevato da attendersi da uomini mortali, e dobbiamo convenire che alcuni gradi di dubbio o di errore possono essere umanamente giustificati.

Molti logici, suppongo, accetterebbero come valutazione della loro scienza le parole di apertura di Keynes nel ‘Treatise on Probability’: “parte della nostra conoscenza si ottiene direttamente, e in parte dalla ragione. La teoria della probabilità si occupa della parte che si ottiene con il ragionamento, e tratta dei diversi gradi in cui i risultati così ottenuti sono inoppugnabili o non inoppugnabili. ” Dove Keynes dice: ‘La teoria della probabilità’, altri direbbero la Logica. Si ritiene, vale a dire, che le nostre opinioni possono essere divise in quelle che possediamo immediatamente come risultato della percezione o della memoria, e quelle che ci derivano dal passato per ragionamento. E’ compito della Logica di accettare quanto viene dalla classe del passato e criticare solo la derivazione di una seconda classe da questa.

La logica come scienza del ragionamento e di inferenza è tradizionalmente e giustamente suddivisa in deduttiva e induttiva; ma la differenza e la relazione tra queste due divisioni del soggetto possono essere concepite in modi estremamente diversi. Secondo Keynes i ragionamenti deduttivi e induttivi validi sono fondamentalmente simili; entrambi sono giustificati da relazioni logiche tra premessa e conclusione che differiscono solo nel grado. Non posso accettare questa posizione, come ho già spiegato. Io non vedo cosa queste relazioni logiche inconclusive possano essere o come possano giustificare convinzioni parziali. Nel caso di ragionamenti logici inoppugnabili posso accettare la ragione della loro validità che è stata data da molte autorità, e la stessa si può trovare sostanzialmente in Kant, De Morgan, Peirce e Wittgenstein. Tutti questi autori concordano sul fatto che la conclusione di un argomento formalmente valido è contenuta nelle sue premesse; che negare la conclusione pur accettando le premesse sarebbe auto-contraddittorio; che la deduzione formale non aumenta la nostra conoscenza, ma mette in evidenza chiaramente ciò che già conosciamo in un’altra forma; e che siamo obbligati ad accettare la sua validità a meno di accettare l’incoerenza con noi stessi. La relazione logica che giustifica l’inferenza è che il senso o il valore della conclusione è contenuto in quello delle premesse.

Ma nel caso di un ragionamento induttivo questo non avviene affatto; è impossibile rappresentarlo come se somigliasse ad un ragionamento deduttivo semplicemente di grado più debole; è assurdo dire che il senso della conclusione è parzialmente contenuto in quello delle premesse. Potremmo accettare le premesse e assolutamente respingere la conclusione, senza alcun tipo di incoerenza o contraddizione. Mi sembra, quindi, che possiamo dividere i ragionamenti in due tipi radicalmente differenti, che noi possiamo riconoscere nelle parole di Peirce come (1) ‘esplicativi, analitici, o deduttivi’ e (2) ‘amplificativi, sintetici, oppure (in senso lato) Induttivi’.1 I ragionamenti del secondo tipo sono da un importante punto di vista molto più vicini ai ricordi e alle percezioni rispetto ai ragionamenti deduttivi. Possiamo considerare la percezione, la memoria e l’induzione come tre fondamentali mezzi per acquisire la conoscenza; la deduzione invece è soltanto un metodo di organizzare la nostra conoscenza e di eliminare incongruenze o contraddizioni.

La logica deve quindi rientrare decisamente in due parti: (escludendo la logica analitica, la teoria dei termini e delle proposizioni) abbiamo la logica minore, che è la logica della coerenza, o logica formale, e la logica maggiore, che è la logica della scoperta, o la logica induttiva.

Quello che abbiamo ora da osservare è che questa distinzione in alcun modo coincide con la distinzione tra certezza e convinzioni parziali; abbiamo visto che esiste una teoria della coerenza nella convinzione parziale non meno della coerenza nella convinzione certe, sebbene per vari motivi la prima non è così importante come la seconda. La teoria della probabilità è in realtà una generalizzazione della logica formale; ma nel processo di generalizzazione uno degli aspetti più importanti della logica formale è demolito.  Se p e  Schermata 2013-08-23 alle 22.32.01       non sono coerenti in modo che q segue logicamente da p, che p implica q è ciò che è chiamato da Wittgenstein una ‘tautologia’ e può essere considerato come un caso degenere di una proposizione vera che non comporti il concetto di coerenza. Questo ci permette di considerare (non del tutto correttamente) la logica formale inclusa la matematica come una scienza oggettiva costituita da proposizioni necessariamente oggettive. Questo ci fornisce non soltanto la ἀνάγκη λέγειν, che se noi affermiamo p siamo costretti dalla coerenza affermare anche q, ma anche l’ ἀνάγκη εἶναι, che se p è vero, così deve essere q. Ma quando estendiamo la logica formale per includere le convinzioni parziali tale interpretazione oggettiva esplicita è perduta;  se crediamo pq nella misura di 1/3 e p  Schermata 2013-08-23 alle 22.32.01   nella misura di 1/3 siamo costretti per coerenza a credere anche  Schermata 2013-11-24 alle 21.04.13     nella misura di 1/3.  Questo è ἀνάγκη λέγειν, ma non possiamo dire che se pq è vero per 1/3 e p Schermata 2013-08-23 alle 22.32.01     vero per 1/3, anche Schermata 2013-11-24 alle 21.04.13  deve essere vero per 1/3, perché questa asserzione sarebbe puro non senso. Lì non ci sarebbe corrispondenza ἀνάγκη εἶναι. Quindi, a differenza del calcolo di coerenza della convinzione piena, il calcolo dell’oggettiva parziale convinzione non può essere immediatamente interpretato come un corpo di oggettiva tautologia.

Questo è però possibile in modo indiretto; abbiamo visto all’inizio di questo saggio che il calcolo delle probabilità potrebbe essere interpretato in termini di rapporti di classi; ora abbiamo scoperto che può anche essere interpretato come un calcolo di coerente convinzione parziale. E’ naturale, quindi, che dovremmo aspettarci una qualche intima connessione tra queste due interpretazioni, una spiegazione della possibilità di applicare lo stesso calcolo matematico a due insiemi diversi di tali fenomeni. Nè c’è una spiegazione difficile da trovare, ci sono molte connessioni tra convinzioni parziali e frequenze. Per esempio, le frequenze sperimentate spesso portano a corrispondenti convinzioni parziali, e convinzioni parziali portano all’aspettativa di frequenze corrispondenti in accordo al teorema di Bernoulli. Ma nessuna di queste è esattamente la correlazione che vorremmo; una convinzione parziale non può in generale essere collegata univocamente con qualsiasi frequenza effettiva, perché la correlazione viene sempre realizzata prendendo la proposizione in questione come un caso di una funzione proposizionale. Quale funzione proposizionale abbiamo scelto è in qualche misura arbitraria e la frequenza corrispondente varierà notevolmente con la nostra scelta. Le pretese di alcuni esponenti della teoria della frequenza che la convinzione parziale significa piena convinzione in una proposizione sulla frequenza non può essere sostenuta.

1 C.S. Peirce Chance Love and Logic, p.92

Ma abbiamo scoperto che l’idea stessa della convinzione parziale comporta il riferimento ad una ipotetica o ideale frequenza; supponendo che il bene abbia la proprietà additiva, credere con il grado m/n è un tipo di convinzione che conduce alla azione che vorremmo fosse la migliore se ripetuta n volte in m delle quali la proposizione sia vera; o potremmo dire più brevemente che questo è il tipo di convinzione più appropriata ad un certo numero di occasioni ipotetiche altrimenti identiche nella proporzione m/n per cui la proposizione in questione è vera. E’ questa correlazione tra convinzione parziale e frequenza che ci permette di utilizzare il calcolo delle frequenze, come un calcolo di coerente convinzione parziale. E in un certo senso possiamo dire che le due interpretazioni sono gli aspetti oggettivi e soggettivi dello stesso significato recondito, così come la logica formale può essere interpretata oggettivamente come un corpo di tautologie e soggettivamente come le leggi del pensiero coerente.

Noi, credo, scopriremo che questo punto di vista del calcolo delle probabilità rimuove varie difficoltà che finora sono stati trovate sconcertanti. In primo luogo ci fornisce una evidente giustificazione degli assiomi di calcolo, che in un sistema come quello di Keynes è totalmente mancante. Perché ora si vede facilmente che se le convinzioni parziali sono coerenti obbediranno a questi assiomi, ma è assolutamente oscuro perché le misteriose relazioni logiche di Keynes dovrebbero obbedire a questi assiomi. 1 Dovremmo essere così stranamente ignoranti degli esempi di queste relazioni, e così stranamente perspicaci circa le loro leggi generali.

In secondo luogo, possiamo fare a meno del Principio di Indifferenza; noi non lo consideriamo appartenente alla logica formale nel dire che sarebbe una previsione di una persona l’estrarre una palla bianca o nera da un’urna; le sue aspettative iniziali potrebbero essere entro i limiti della coerenza qualcosa che egli preferisce; tutto quello che dobbiamo sottolineare è che se ha certe aspettative egli è tenuto per coerenza ad averne certe altre. Questo è semplicemente prendere la probabilità sullo stesso piano della normale logica formale, che non critica le premesse, ma dichiara semplicemente che alcune conclusioni sono le sole coerenti con esse. Essere in grado portare fuori dalla logica formale il Principio di Indifferenza è un grande vantaggio; perché è abbastanza evidentemente impossibile stabilire condizioni puramente logiche per la sua validità, come viene tentato da Keynes. Non voglio discutere la questione in dettaglio, perché porta alla pedanteria e a distinzioni arbitrarie che potrebbero essere discusse per sempre. Ma chi cerca di decidere con i metodi di Keynes quali siano le alternative adeguate a considerare l’equiprobabile nella meccanica delle molecole, ad esempio in Gibbs nello spazio-fase, sarà presto convinto che sia una questione di fisica piuttosto che di logica pura. Usando la formula di moltiplicazione, come viene usato nella probabilità inversa, possiamo in base alla teoria di Keynes ridurre tutte le probabilità a quozienti di probabilità a priori; ed è quindi con riguardo a questi ultimi che il principio di indifferenza è di primaria importanza, ma qui il problema non è ovviamente un problema di logica formale. Come possiamo semplicemente su basi logiche suddividere lo spettro in bande equiprobabili?

Nel sistema di Keynes appare come se gli assiomi principali – le leggi di addizione e moltiplicazione – non siano altro che definizioni. Si tratta semplicemente di un errore logico; le sue definizioni sono formalmente errate, a meno che vengano assunti i corrispondenti assiomi. Così la sua definizione di moltiplicazione presuppone la legge che se la probabilità di a dato bh è uguale a quella di c dato dh, e la probabilità di b dato h è uguale a quella di d dato k, allora la probabilità di ab dato h e di cd dato k saranno uguali.

Una terza difficoltà che viene eliminata dalla nostra teoria è quella che è presente nella teoria di Keynes nel caso seguente. Credo di percepire o ricordare qualcosa ma non sono sicuro; questo sembrerebbe darmi qualche motivo di credere, contrariamente alla teoria di Keynes,per cui il grado di convinzione che dovrei avere essendo razionale per me  è quello dato dal rapporto di probabilità tra la proposizione in questione e le cose che so per certe. Egli non può giustificare una probabile convinzione fondata non su ragionamenti ma su diretta sperimentazione. A nostro avviso non ci sarebbe niente di contrario alla logica formale, in una tale convinzione; se questo sia ragionevole dipenderà da quello che ho chiamato la grande logica che sarà il soggetto del prossimo capitolo; vedremo che non c’è nessuna obiezione a tale possibilità, con la quale il metodo di Keynes di giustificare la probabile convinzione esclusivamente attraverso relazione di conoscenza certa non è assolutamente in grado di sostenere.

(5) LA LOGICA DELLA VERITÁ

La validità della distinzione tra la logica di coerenza e la logica della verità è stata spesso contestata; è stato sostenuto da un lato che la coerenza logica è solo una specie di coerenza basata sui fatti; che se la convinzione in p non è coerente con una in q, significa semplicemente che p e q non sono entrambe vere, e che questo è un fatto necessario o fatto logico. Personalmente, ritengo che questa difficoltà può essere soddisfatta dalla teoria di Wittgenstein sulla tautologia, secondo la quale se una convinzione in p è incompatibile con quella di q che p e q non sono entrambe vere non è un fatto, ma una tautologia. Ma io non mi propongo di discutere di questo problema ulteriormente qui.

Dall’altra parte si sostiene che la logica formale o la logica di coerenza sia  l’insieme della logica e la logica induttiva  sia o un nonsenso o una parte delle scienze naturali. Questa asserzione, che suppongo che sia stata fatta da da Wittgenstein, sento più difficile da controbattere. Ma io credo che sarebbe un peccato, a causa del rispetto verso l’autorità, rinunciare a provare a dire qualcosa di utile sull’induzione.

Dobbiamo quindi tornare indietro alla concezione generale della logica come scienza del pensiero razionale. Noi troviamo che le parti più generalmente accettate della logica, vale a dire, la logica formale, la matematica e il calcolo delle probabilità, riguardano tutte semplicemente il garantire che le nostre convinzioni non siano auto-contraddittorie. Abbiamo posto davanti a noi stessi i criteri di coerenza e costruito queste elaborate regole per garantirne l’osservanza. Ma ovviamente questo non basta; vogliamo che le nostre convinzioni siano coerenti non solo l’una con l’altra ma anche con i fatti 1: né è ancora chiaro che la coerenza sia sempre vantaggiosa; ma potrebbe essere meglio essere a volte nel giusto che mai nel giusto. Né quando vogliamo essere coerenti siamo sempre in grado di esserlo: ci sono proposizioni matematiche la cui verità o falsità non può ancora essere decisa. Eppure si può umanamente parlando di avere diritto di prendere in considerazione un certo grado di convinzione in quelle per motivi induttivi o su altre basi: una logica che si propone di giustificare un tale grado di convinzione deve essere disposta in realtà  ad andare contro la logica formale; perché a una verità formale logica si può assegnare solo una convinzione di grado 1. Si potrebbe dimostrare nel sistema di Keynes che la sua probabilità è pari a 1 in qualsiasi prova. Questo punto mi sembra di dimostrare in modo particolarmente evidente che la logica umana o la logica della verità, che dice agli uomini come dovrebbero pensare, non è solo indipendente, ma a volte in realtà incompatibile con la logica formale.

1 Cfr.. Kant: ‘Denn obgleich eine Erkenntnis der logischen Form völlig gemäss sein möchte, dass ist sich selbst nicht widerspräche, so kann sie doch noch immer dem Gegenstande widersprechen.’ Kritik der reinen Vernunft, ‘, Prima Edizione p. 59. Infatti, sebbene la conoscenza della forma logica sia del tutto coerente cioè non contraria a sé, può tuttavia essere in disaccordo con l’oggetto ‘. Critica della ragion pura.

Nonostante questo quasi tutto il pensiero filosofico sulla logica umana e in particolare sull’induzione ha cercato di ridurlo in qualche modo alla logica formale. Non si suppone questo, se non da pochissimi, che la coerenza da sé stessa conduca alla verità; ma che alla coerenza con l’osservazione e la memoria spesso è attribuito questo potere.

Dal momento che un’osservazione ha cambiato (almeno in grado) la mia opinione sul fatto osservato, alcuni dei miei gradi di convinzione dopo l’osservazione sono necessariamente non coerenti con quelli che avevo prima. Dobbiamo quindi spiegare come esattamente l’osservazione potrebbe modificare i miei gradi di convinzione; ovviamente se p è il fatto osservato, il mio grado di convinzione in q dopo l’osservazione dovrebbe essere uguale al mio grado di convinzione in q dato p di prima, o dalla legge di moltiplicazione, al quoziente del mio grado di convinzione in pq per il mio grado di convinzione in p . Quando i miei gradi di convinzione cambiano in questo modo possiamo dire che essi sono stati modificati coerentemente con la mia osservazione.

Usando questa definizione, o nel sistema di Keynes semplicemente utilizzando la legge di moltiplicazione, possiamo prendere i miei attuali gradi di convinzione, e considerando la totalità delle mie osservazioni, scoprire da quali gradi iniziali di convinzione i miei attuali gradi di convinzione sarebbero sorti da questo processo di coerente modifica. I miei livelli attuali di convinzione possono quindi essere considerati logicamente giustificati se i corrispondenti gradi iniziali di convinzione sono logicamente giustificati. Ma il chiedere quali gradi iniziali di convinzione siamo giustificati, o nel sistema di Keynes quali sono le probabilità assolute a priori, mi sembra un problema senza senso; e anche se avesse un significato non vedo come potrebbe essere risolto.

Se abbiamo effettivamente applicato questo processo per un essere umano, scoperto, vale a dire, su quali probabilità a priori le sue opinioni attuali dovrebbero essere basate, dovremmo ovviamente trovarle tra quelle determinate da selezione naturale, con una generale tendenza a dare una maggiore probabilità alle alternative più semplici. Ma, come ho detto , non riesco a vedere quale potrebbe essere lo scopo di chiedersi se questi gradi di convinzione siano logicamente giustificati.

Ovviamente la cosa migliore sarebbe quella di sapere con certezza in anticipo che cosa sia vero e cosa falso, e quindi se un qualsiasi sistema di convinzioni iniziali dovesse ricevere l’approvazione del filosofo dovrebbe essere questo. Ma evidentemente questo non sarebbe accettato dai pensatori della scuola che sto criticando. Un’altra alternativa è quella di ripartire le probabilità iniziali sul sistema puramente formale esposto da Wittgenstein, ma come questo non fornisce alcuna giustificazione per l’induzione non può darci la logica umana che stiamo cercando.

Dobbiamo quindi cercare di avere un’idea di una logica umana che non deve tentare di essere riducibile alla logica formale. La logica, possiamo essere d’accordo, non riguarda ciò che gli uomini credono davvero, ma quello che dovrebbero credere, o quello che sarebbe ragionevole credere. Cosa significa allora, dobbiamo chiederci, dire che è ragionevole per un uomo avere questo o quel grado di convinzione in una proposizione? Prendiamo in considerazione le possibili alternative.

In primo luogo, questo significa a volte qualcosa di spiegabile in termini di logica formale: possiamo abbandonare questa possibilità per i motivi già spiegati. In secondo luogo, a volte significa semplicemente che essendo io al suo posto (e non ad esempio ubriaco) avrei avuto un tale grado di convinzione. In terzo luogo, a volte significa che se la sua mente lavora secondo certe regole, che possiamo approssimativamente chiamare ‘metodo scientifico’, avrebbe avuto un tale grado di convinzione. Ma in quarto luogo non è necessario sostenere nessuna di queste cose; perché gli uomini non hanno sempre creduto nel metodo scientifico, e proprio come noi domandiamo’ Ma io sono necessariamente ragionevole‘, possiamo anche chiedere ‘Ma è lo scienziato necessariamente ragionevole?’ In quest’ultimo significato mi sembra che possiamo identificare una ragionevole opinione con l’opinione di una persona ideale in circostanze analoghe. Quale, invece, sarebbe l’opinione di questa persona ideale ? Come è stato già osservato, il più alto ideale sarebbe sempre che avrebbe una opinione vera e sarebbe certo di ciò; ma questo ideale è più adatto a Dio che all’uomo.1

Dobbiamo dunque considerare la mente umana e ciò che è il massimo che possiamo chiedere ad essa. 2 La mente umana lavora essenzialmente in base a regole generali o abitudini; un processo mentale che non procede secondo qualche regola sarebbe semplicemente una sequenza casuale di idee; ogni volta che si deduce A da B lo facciamo in virtù di una qualche relazione tra di loro. Possiamo quindi affermare il problema dell’ideale come ” Quali abitudini in senso generale sarebbero le migliori che avesse la mente umana? ” Questo è un grande e indeterminato problema che difficilmente potrebbe essere risolto a meno che le possibilità fossero dapprima state limitate da una concezione abbastanza precisa della natura umana. Potremmo immaginare alcune abitudini molto utili diverse da quelle possedute da tutti gli uomini. [ Va precisato che io uso l’abitudine con il significato più ampio possibile per significare semplicemente regola o legge di comportamento, tra cui l’istinto: non voglio distinguere regole o abitudini acquisiti in senso stretto dalle regole innate o istinti, ma mi propongo di chiamarle tutte ugualmente abitudini.] Una analisi del tutto generale della mente umana è quindi destinata ad essere vaga e futile, ma qualcosa di utile si può dire se limitiamo l’argomento nel modo seguente.

Supponiamo di avere l’abitudine di formare un’opinione in un certo modo; ad esempio l’abitudine di derivare dall’opinione che un fungo è giallo l’opinione che sia velenoso. Allora possiamo accettare il fatto che la persona ha un’abitudine di questo genere, e chiedere semplicemente quale grado di parere che il fungo è velenoso sarebbe meglio per lui prendere in considerazione quando lo vede; cioè ammettendo che pensa sempre nello stesso modo su tutti i funghi gialli, possiamo chiedere quale sia il grado di fiducia migliore che lui dovrebbe avere che quei funghi siano velenosi. E la risposta è che sarà in generale migliore per il suo grado di convinzione che un fungo giallo è velenoso sia pari alla quota di funghi gialli che sono in realtà velenosi. (Ciò deriva dal significato del grado di convinzione.) Questa conclusione è necessariamente vaga per quanto riguarda l’area spazio-temporale dei funghi, che include, ma difficilmente più vaga della domanda a cui risponde. (Cfr. densità in un punto di gas composto da molecole.)

1[ Una precedente stesura della materia del paragrafo in qualche modo migliore. – F.P.R. Che cosa si intende dicendo che un certo grado di convinzione è ragionevole ? Primo e spesso che è quello che prenderei in considerazione se avessi i pareri della persona in questione al momento, ma erano diversi da come sono adesso, ad esempio, non ubriachi. Ma a volte andiamo oltre e chiediamo: ‘ Sono ragionevole?’ Questo può significare, mi comporto conformemente a determinate norme, enumerabili che noi chiamiamo metodo scientifico, e che stimiamo a causa del valore di chi lo pratica ed il successo che raggiunge. In questo senso essere ragionevoli significa pensare come uno scienziato, o essere guidato solo da raziocinio e induzione o qualcosa del genere (vale a dire mezzi ragionevoli di riflessione). In terzo luogo, possiamo andare alla radice del perché ammiriamo lo scienziato e analizziamo non un parere particolare primario, ma un abitudine mentale che conduce o meno alla scoperta della verità o prende in considerazione quei gradi di convinzione che sarebbero più utili. (Per includere le abitudini al dubbio o alla convinzione parziale). Allora possiamo considerare un parere secondo l’ abitudine che lo ha prodotto. Questo è chiaramente ragionevole, perché tutto dipende da questa abitudine; ma non sarebbe ragionevole ottenere la giusta conclusione di un sillogismo ricordando in modo impreciso che si lascia fuori un termine che è comune ad entrambe le premesse. Usiamo ragionevole nel senso 1 quando parliamo di un argomento di uno scienziato questo non mi sembra ragionevole; nel senso 2 quando confrontiamo la ragione e superstizione o istinto; nel senso 3 quando si valuta il valore dei nuovi metodi di pensiero come la divinazione.]

2 Quello che segue fino alla fine della sezione è quasi interamente basato sugli scritti di C.S. Peirce . [Soprattutto le sue ” illustrazioni della Logica della scienza “, Popular Science Monthly 1877 e 1878 , ristampato in Chance Love and Logic ( 1923).]

Mettiamola in un altro modo: ogni volta che faccio una deduzione, la faccio in base a qualche regola o abitudine. Un’inferenza non è completamente data quando ci è data la premessa e la conclusione; deve essere data anche la relazione fra esse in virtù della quale viene realizzata la deduzione. La mente funziona per leggi generali; quindi se deduce q da p , questo sarà generalmente perché q è un caso di una funzione φx e p il corrispondente caso di una funzione ψx tale che la mente sempre dedurrà φx da ψx . Quando quindi non analizziamo le opinioni, ma i processi attraverso cui sono nate, la regola della deduzione determina per noi un intervallo a cui la teoria della frequenza può essere applicata. La regola di deduzione può essere ristretta, come quando vedendo un fulmine mi aspetto il tuono, o larga , come quando si considerano 99 casi di una generalizzazione che ho osservato per essere vera concludo che il centesimo anche è vero. Nel primo caso, l’abitudine che determina il processo è ‘ Dopo il lampo si aspetta il tuono ‘; il grado di affidamento che sarebbe il migliore per questa abitudine da esprimere è pari al rapporto tra i casi di lampi che siano effettivamente seguiti da tuoni. Nel secondo caso l’abitudine è quella più generale di inferire da 99 casi osservati un certo tipo di generalizzazione che il centesimo è anche vero; il grado di convinzione che sarebbe meglio per questa abitudine da esprimere è uguale alla proporzione di tutti i casi dei 99 esempi di una generalizzazione che è vera, in cui anche il centesimo è vero.

Così dato un unico parere , possiamo solo lodarlo o biasimarlo sulla base della verità o della falsità: data l’abitudine ad una certa forma, possiamo lodarlo o biasimarlo di conseguenza a seconda che il grado di convinzione che produce sia vicino o lontano dalla reale proporzione in cui l’abitudine conduce alla verità. Possiamo allora lodare o biasimare opinioni in forma derivata dalla nostra lode o biasimo delle abitudini che li producono.

Questa relazione può essere applicata non solo alle abitudini di deduzione, ma anche alle abitudini di osservazione e alla memoria; quando abbiamo una certa sensazione in relazione con un’immagine pensiamo che l’ immagine rappresenti qualcosa che in realtà è successo a noi, ma non possiamo esserne sicuri; il grado di diretta fiducia nella nostra memoria varia. Se ci chiediamo qual è il miglior grado di fiducia che possiamo riporre in una sicura specifica sensazione di memoria, la risposta deve dipendere da quanto spesso, quando questo sentimento si verifica l’evento a cui l’immagine si collega si è veramente verificato.

Tra le abitudini della mente umana una posizione di particolare importanza è occupata dall’induzione. Fin dai tempi di Hume molto è stato scritto circa la giustificazione dell’inferenza induttiva. Hume ha mostrato che non poteva essere ridotta a inferenza deduttiva o giustificata dalla logica formale. Nel modo in cui si sviluppa la sua dimostrazione mi sembra definitiva; e il suggerimento di Keynes che può essere aggirata per quanto riguarda l’induzione come una forma di inferenza probabile, non può a mio avviso essere accettato. Ma supporre che la situazione che ne deriva sia uno scandalo per la filosofia è, a mio avviso, un errore.

Siamo tutti convinti per ragionamenti induttivi, e la nostra convinzione è ragionevole, perché il mondo è così costituito che gli argomenti induttivi conducono tutto sommato a pareri veri. Non siamo, pertanto, in grado di avere fiducia nell’induzione, né se potessimo aiutarla non vedremmo alcuna ragione per cui dovremmo, perché noi crediamo che sia un processo affidabile. E vero che che se qualcuno non ha l’abitudine nell’induzione, non potremmo dimostrargli che sbaglia; ma non c’è nulla di particolare in questo. Se un uomo dubita della propria memoria o della sua percezione non possiamo dimostrargli che sono affidabili; il chiedere per questo una cosa che lo provi è piangere per la luna, e lo stesso vale per l’induzione. E’ una delle principali fonti di conoscenza così come lo è la memoria: nessuno considera uno scandalo per la filosofia che non c’è la prova che il mondo non sia cominciato due minuti fa e che tutti i nostri ricordi non siano illusori.

Siamo tutti d’accordo che un uomo che non ha fatto induzioni sarebbe non razionale: il problema è solo ciò che questo significa. A mio parere ciò non significa che l’uomo peccherebbe contro la logica formale o la probabilità formale; ma che non avrebbe acquisito un’abitudine molto utile, senza la quale starebbe molto peggio, nel senso di essere molto meno probabile 1 che abbia opinioni vere.

Si tratta di una sorta di pragmatismo: noi giudichiamo le abitudini mentali a seconda se funzionano, cioè se le opinioni che inducono siano per la maggior parte vere, o più spesso vere di quelle che differenti abitudini indurrebbero.

L’induzione è una abitudine utile, e ad adottarla è ragionevole. Tutto ciò che la filosofia può fare è di analizzarla, determinare il grado della sua utilità, e trovare da quali caratteristiche della natura, questa dipenda. Un mezzo indispensabile per indagare questi problemi è l’induzione stessa, senza la quale saremmo impotenti. In questa circolarità non si si trova nessun circolo vizioso. E’ solo attraverso la memoria che possiamo determinare il grado di accuratezza della memoria; perché se facciamo esperimenti per determinare questo effetto, essi saranno inutili se non li ricordassimo.

Si consideri, alla luce della discussione precedente quale tipo di soggetto sia induttivo o di logica umana – la logica della verità. La sua attività è quella di prendere in considerazione i metodi di pensare, e scoprire che misura di fiducia si debba riporre in questi, vale a dire in quale proporzione di esperienze essi conducono alla verità. In questa analisi essa può solo essere distinta dalle scienze naturali per la maggiore generalità dei suoi problemi. Si deve considerare la relativa validità dei diversi tipi di procedure scientifiche, come ad esempio la ricerca di una legge causale con i Metodi Mill, ed i moderni metodi matematici come il ragionamento a priori usato nella scoperta della Teoria della Relatività. Il progetto corretto di tale soggetto si può trovare in Mill 1, io non intendo i dettagli dei suoi Metodi o anche l’uso della Legge di Causalità. Ma il suo modo di trattare l’argomento come un corpo di induzioni riguardante induzioni, la Legge di Causalità che governa meno le leggi essendo essa stessa dimostrata per induzione per semplice enumerazione. I diversi metodi scientifici che possono essere utilizzati sono in ultima istanza valutati per induzione per semplice enumerazione; abbiamo scelto la più semplice legge che si adatta ai fatti, ma se non scopriamo che leggi così ottenute si adattano anche a fatti differenti da quelli per cui erano state realizzate per adattarsi, dobbiamo scartare questa procedura per qualche altra.

1 ‘probabile’ qui significa semplicemente che io non sono sicuro di questo, ma ho solo un certo grado di convinzione in esso.

 Cfr.. anche la relazione sulle ‘General rules’ nel capitolo ‘Of Unphilosophical Probability’ nel Trattato di Hume.

SOCIALISM AND EQUALITY OF INCOME

21 Dic

LeninPropongo la  traduzione di questo articolo di Frank Ramsey letto alla Apostles Society di Cambridge il 3 Febbraio 1923. Il testo è stato pubblicato dalla prof.ssa Maria Carla Galavotti nel libro Notes on Philosophy, Probability and Mathematics ed. Bibliopolis. Al termine riporto la trattazione in lingua originale.

SOCIALISMO E UGUAGLIANZA DI REDDITO

3 Febbraio 1923

In un discorso tenuto l’altro giorno Maynard ha detto che, sebbene ci siano più uomini al lavoro al giorno d’oggi, che prima della guerra, tuttavia  a causa della crescita della popolazione era probabile che non saremmo in grado di trovare occupazione per tutta la nostra attuale popolazione tranne che nei periodi di boom. Non vi è alcuna necessità di allargarsi qui sui mali della disoccupazione, ma siamo costretti a considerare se non c’è modo di evitare questa cupa prospettiva. Penso che un certo modo sia determinato dalla progressiva assunzione da parte dello Stato della proprietà e del controllo dell’industria; questo io lo chiamo socialismo.

Gli argomenti a favore e contro il socialismo che mi sembrano importanti sono quelli tratti dai suoi probabili effetti sulla quantità di ricchezza prodotta e sulla proporzione in cui questa viene distribuita tra la popolazione. Ci sono altri argomenti, ma io non li considererò qui.

In primo luogo poi mi propongo di esaminare, se lo stato dovesse possedere e controllare l’industria, se verrebbe prodotta più o meno ricchezza, in relazione, ovviamente, al tempo sacrificato, all’uso di energia, e al disagio sostenuto per produrla. Argomenti di questo possono essere classificati in due punti principali; quelli che evidenziano vantaggi o svantaggi che deriverebbero dalla unificazione del settore e la sostituzione della pubblica utilità al guadagno privato come obbiettivo della produzione; e quelli che sostengono che l’efficienza industriale di varie classi di persone verrebbero aumentati o diminuiti se diventassero dipendenti dello Stato.

Iniziamo con il primo tipo di argomento; mi sembra chiaro che con l’eliminazione della concorrenza si potrebbero fare grandi economie; il costo di vendita dei beni, al contrario del realizzarli, potrebbe essere enormemente ridotto in quanto una grande quantità di pubblicità e di viaggi commerciali diventerebbero inutili. E in altri oscuri modi per il profano l’unificazione significherebbe economia; ad esempio l’attuale organizzazione del settore del carbone è stata dichiarata dagli esperti essere un grande spreco. Si asserisce, tuttavia,  che in certi settori c’è un limite oltre il quale è sconsigliabile aumentare la dimensione delle unità di produzione; anche in questo caso non vedo alcuna ragione per cui uno stato socialista non deve organizzare la produzione in unità di dimensioni più vantaggiose.

Una gran quantità di spreco dovuto alla competizione che esiste attualmente potrebbe essere eliminato dalla crescita di monopoli, ma questo processo è seguito da mali abbastanza altrettanto grandi di quelli che vorrebbe evitare, perché i monopoli, fissando i prezzi e limitando la produzione, possono estorcere profitti eccessivi dal consumatore.

Oltre ai vantaggi dell’unificazione altri benefici deriverebbero se la produzione fosse diretta da funzionari statali anziché dal capitalista che ricerca il proprio privato profitto, nel senso che potremmo fare un uso più oculato delle nostre risorse naturali come le foreste e i minerali. Ma penso che il più grande spreco che uno stato socialista potrebbe eliminare è quello dovuto alla disoccupazione, noi ora abbiamo avuto per qualche tempo circa un milione e mezzo di disoccupati, ovvero 1 su 8 dei lavoratori dell’industria in generale, ma la percentuale in alcuni settori sarebbe molto superiore. Queste persone devono essere sostenute da fondi pubblici e quando l’aiuto dato loro è insufficiente, come è generalmente il caso, la loro salute soffre di mancanza di cibo e diventa sempre più difficile per loro di riprendere il proprio lavoro di nuovo e di farlo in modo efficiente. Non credo che questa situazione in cui 1 uomo su 8 non riesce a trovare lavoro non possa essere evitata da un’organizzazione industriale competente.

Una certa disoccupazione ci deve essere in quanto non è possibile prevedere esattamente quanto di ogni prodotto può essere venduto, ma questa alternanza perpetua di boom e crisi non deve essere necessaria, ed è dovuta a difetti del nostro sistema industriale e finanziario e sagacia dei nostri uomini d’affari.

L’argomento forte utilizzato dagli oppositori del socialismo è che i funzionari statali sono inefficienti e senza iniziativa e che pertanto l’abolizione delle imprese private significherebbe una grande diminuzione della efficienza della produzione. Non credo questo, può essere che dobbiamo molto ai grandi industriali e finanzieri, e che fintanto che questi uomini hanno la scelta tra il servizio statale e l’attività privata essi sceglieranno la seconda, in tal modo rendendolo così più efficiente rispetto al servizio statale. Ma se questa scelta venisse tolta e ci fosse solo il servizio statale penso che lavorerebbero per lo Stato non molto meno efficientemente di quanto non facciano per sé stessi. Eppure io non nego che tale argomento abbia un peso, come lo ha anche la tesi che i servizi statali non sono sufficientemente pronti a correre dei rischi, essendo il biasimo in cui incorrono per un insuccesso maggiore della ricompensa per il successo; ma contro questo dobbiamo porre tre fattori che tenderebbero a rendere lo Stato più efficiente che l’impresa privata .

In primo luogo un gran numero di abili uomini d’affari oggigiorno non prestano allo stato un qualsiasi servizio degno di considerazione, perché spendono la loro energia non nell’organizzazione della produzione, ma in varie forme di speculazione, con cui accumulano fortune a scapito di altre persone. E’ vero che la speculazione fa qualcosa di buono nel tendere a livellare i prezzi, ma in questo non c’è un grande successo in quanto i prezzi hanno oscillato enormemente negli ultimi anni. In uno stato socialista, questi uomini avrebbero dovuto sfruttare meglio il loro ingegno, e i loro servizi sarebbero ottenuti più a buon mercato in quanto potrebbero ricevere solo stipendi ragionevoli, invece di fare milioni.

In secondo luogo il comune corso degli uomini d’affari sembra essere molto stupido; ottenendo solo le loro posizioni dai loro genitori.

Che il controllo delle nostre industrie debba passare a causa di un tale nepotismo nelle mani di stolti è uno scandalo che non sarebbe tollerato nel servizio dello Stato. Con un esame di concorso o in qualche altro modo, lo Stato non potrebbe mancare di essere in grado di selezionare le persone più efficienti rispetto agli uomini d’affari di oggi.

In terzo luogo sotto il socialismo è da aspettarsi che gli operai lavorerebbero meglio che oggi; non sarebbe così scontenti e inclini allo sciopero in un sistema in cui il reddito nazionale verrebbe distribuito più uniformemente. Perché se hanno scioperato per salari più alti di quanto fosse ragionevole non avrebbero, come accade oggi, il sostegno e la simpatia di tutti gli altri sindacati contro il comune nemico il datore di lavoro. Questo argomento non si accorda sottolineando che nelle industrie nazionalizzate gli scioperi sono frequenti così come che nelle altre, perché l’essenza della tesi è che i lavoratori sarebbero più soddisfatti se il reddito nazionale fosse più equamente diviso, e questo non è determinato dalla semplice nazionalizzazione di alcune industrie. Inoltre, se la paura della disoccupazione fosse rimossa, gli operai non sarebbero così propensi ad andare piano con il loro lavoro per evitare che il loro lavoro termini, o ad opporsi all’ammissione di più persone nel loro mestiere. Oggi ogni aumento del potere del sindacalismo significa più conflitto industriale e più limitazione della produzione da parte dei lavoratori. Non appena gli operai diventano più istruiti risultano più scontenti e il socialismo è l’unico modo che vedo per evitare questo problema .

Potrei forse dire che penso che l’industria potrebbe essere molto più efficientemente gestita dallo Stato, se fossero apportati alcuni miglioramenti nella Costituzione inglese e realizzate altre raccomandazioni più dettagliate contenute nella «Costituzione per il Commonwealth socialista della Gran Bretagna» del signor e la signora Webb.

Passo ora alla seconda questione che ho proposto di prendere in considerazione, gli effetti del socialismo sulla distribuzione del reddito. In primo luogo, è chiaro che questo potrebbe non essere affatto grande, l’assunzione da parte dello Stato della proprietà industriale, acquistandola dai proprietari attuali, non cambia necessariamente molto la distribuzione del reddito; renderebbe impossibile che si costituiscano ulteriori ricchezze nel settore industriale, ma non ridurrebbe le ricchezze attuali o il reddito derivato da esse. Questo, se lo si desidera, potrebbe essere realizzato attraverso la tassazione. Ma è ragionevole supporre che uno Stato socialista prenderebbe provvedimenti per distribuire il reddito nazionale più equamente, in quanto la pressione dell’opinione pubblica sarebbe in quella direzione; e questo è il grande vantaggio che la maggior parte dei suoi sostenitori vedono nel socialismo. Ora mi accingo a considerare se sarebbe davvero un vantaggio; o, più in generale, qual è il metodo più desiderabile della distribuzione del reddito nazionale.

Inizierò con i due argomenti che mi sembrano decisivi a favore di una distribuzione approssimativamente uguale. In primo luogo vi è l’argomento economico dalla legge dell’utilità marginale decrescente, o per dirla in modo non tecnico che se i redditi sono diseguali, le esigenze meno pressanti dei ricchi hanno la precedenza sui bisogni più pressanti dei poveri, e che quindi la felicità aggregata viene aumentata prendendo il denaro ai ricchi per darlo ai poveri. Questo argomento deve naturalmente essere qualificato ammettendo che gli uomini differiscono nella loro capacità di fare buon uso del denaro; e se ci fosse un modo affidabile di accertare tali differenze tra gli uomini e adeguare i loro redditi per corrispondervi, sarebbe chiaramente una buona cosa farlo. Ma non credo che questa precisazione possa essere usata per giustificare che un qualsiasi laureato abbia più di 500 sterline l’anno al massimo.

In secondo luogo vi è un argomento sociale a favore della parità di reddito; che solo così possiamo evitare l’esistenza delle classi sociali più o meno ereditarie. Gli svantaggi di un sistema di classi sono in primo luogo che questo limita le pari opportunità, che non è solo ingiusto, ma dannoso per la comunità, in quanto implica che alcuni posti di lavoro qualificati sono dati senza necessità a persone incompetenti; e in secondo luogo che limita l’area di selezione sessuale e sociale.

Supponendo poi che il reddito nazionale debba essere quasi equamente distribuito, possiamo notare alcune eccezioni minori che dovrebbero essere fatte. Se di due occupazioni una è più sgradevole, quindi, a parità di altre condizioni, questa dovrebbe essere più altamente remunerata. Inoltre un uomo dovrebbe essere in grado di risparmiare e lasciare alla sua famiglia una moderata quantità di denaro; e probabilmente sarebbe saggio per incoraggiare questo risparmio pagare interessi su tali risparmi .

La più importante e difficile questione è la remunerazione del lavoro specializzato cerebrale; a questo proposito mi vengono in mente tre punti. Per primo che a meno che non sia più ben pagato del lavoro ordinario non è probabile venga svolto così come potrebbe essere; ma in secondo luogo, in quanto è più interessante del lavoro ordinario  questa dovrebbe essere una ragione per essere pagato di meno; in terzo luogo che coloro che sono capaci di lavoro cerebrale specialistico sono forse più adatti a fare buon uso del denaro e del tempo libero di quanto lo siano altri e quindi ne dovrebbe essere dato di più. La conclusione a cui giungo è che queste persone dovrebbero avere un reddito più grande, ma non molto più grande rispetto al resto del genere umano .

Infine vi è la questione se il costo di una famiglia dovrebbe essere sostenuto dal padre o dallo Stato. Da un lato sembra ragionevole che chi ama il piacere di avere bambini dovrebbero sopportare il costo per proprio conto; ma d’altra parte il principio di fare che il reddito nazionale vada avanti per quanto possibile rende ragionevole condurre verso il mantenimento dei bambini da parte dello Stato. Evidentemente la miseria dei poveri sarebbe oggi notevolmente alleviata se i redditi fossero proporzionati alla dimensione della famiglia; e questo programma è di fatto adottato nell’assistenza ai poveri e nelle pensioni governative e nelle indennità di disoccupazione. La principale obiezione ad essa oggi è che probabilmente la popolazione tenderà ad aumentare; ma se tale obiezione manterrà la sua forza quando le persone conosceranno il controllo delle nascite e saranno abbastanza istruite da praticarlo, l’obiezione mi sembra molto dubbia. Dal punto di vista eugenetico sarebbe ovviamente consigliabile incoraggiare con generosità coloro che raggiungessero l’ indubbio livello di intelligenza di avere figli.

Questo è il testo in lingua originale:

SOCIALISM AND EQUALITY OF INCOME

3 Feb 1923

In a speech the other day Maynard said that, although there were more men in work to-day than before the war, yet owing to the increase in population it was probable that we should be unable to find employment for the whole of our present population except in times of boom. There is no need to enlarge here on the evils of unemployment, but we are forced to consider whether there is no way of avoiding this gloomy prospect. I think that such a way is provided by the gradual assumption by the state of the ownership and control of industry; this I call Socialism.

The arguments for and against Socialism which seem to me important are those,drawn from its probable effects on the quantity of wealth produced and on the proportions in which this is distributed among the population. There are other arguments but I shall not consider them here.

First then I propose to consider whether, if the state were to own and control industry, more or less wealth would be produced, in relation, of course, to the sacrifices of time, energy, and discomfort incurred in producing it. Arguments about this can be classified under two heads; those exhibiting advantages or disadvantages, which would arise from the unification of industry and the substitution of public benefit for private gain as the object of production; and those which maintain that the industrial efficiency of various classes of personnel would be increased or diminished if they became servants of the state.

To begin with the first kind of argument; it seems clear that by the elimination of competition great economies could be effected; the cost of selling goods, as opposed to making them, could be enormously reduced, as a large amount of advertising and commercial travelling would become unnecessary. And in other ways obscure to the layman unification would mean economy; for instance the present organization of the coal industry has been declared by experts to be extremely wasteful. It is, however, asserted that in certain industries there is a limit beyond which it is inexpedient to increase the size of the unit of production; even so I see no reason why a Socialist state should not organize production in units of the most advantageous size.

To a great extent the waste of competition is at present being eliminated by the growth of trusts; but this process is attended by evils quite equally great as those which it voids, because the trusts, by fixing prices and restricting output, can extort unreasonable profits from the consumer.

Beside the advantages of unification other benefits would result if production were directed by state officials instead of by capitalist seeking their private profit, in that we should make a more farsighted use of our natural resources such as forests and minerals. But I think that the largest waste that a Socialist state could eliminate is that due to unemployment, we have now had for some time about 1 1/2 million people unemployed, or 1 in 8 of industrial workers generally, the proportion in some industries being much higher. These people have to be supported out of public funds and when the relief given them is inadequate, as is generally the case, their health suffers from lack of food and it becomes more and more difficult for them to take up their work again and do it efficiently. I do not believe that this situation in which 1 man in 8 cannot find work could not be avoided by competent industrial organization.

Some unemployment there must be as it is not possible to foresee exactly how much of each product can be sold, but this perpetual alternation of boom and slump must be unnecessary, and due to defects in our industrial and financial system and in the wisdom of our business men.

The strongest argument used by opponents of Socialism is that state officials are inefficient and unenterprising and that therefore the abolition of private enterprise would mean a great decrease in the efficiency of production. I do not believe this; it may be that we owe much to great industrialists and financiers, and that so long as these men have the choice between the civil service and private business they will choose the latter, thereby rendering it more efficient than the civil service. But if this choice were removed and there were only the civil service I think they would work for the State not much less efficiently than they do for themselves. Still I do not deny that this argument has weight, as has also the contention that state departments are not sufficiently ready to take risks, the blame incurred for failure being greater than the reward for success; but against it we have to set three factors which would tend to make the state more efficient than the private firm.

First a large number of the cleverest business men to-day are not rendering the state any considerable service, because they spend their energy not in organizing production, but in various forms of speculation, in which they amass fortunes at the expense of other people. It is true that speculation does some good by tending to equalise prices; but in this it is not very successful as prices have fluctuated enormously in the last few years. In a Socialist state these men would have to make better use of their ingenuity; and their services would be obtained more cheaply as they would only receive reasonable salaries instead of making millions.

Secondly the common run of business men appear to be very stupid; only obtaining their positions from their parents.

That the control of our industries should pass by such nepotism into the hands of fools is a scandal which would not be tolerated in the civil service. By competitive examination or in some other way, the State could hardly fail to be able to select more efficient people than the business men of to-day.

Thirdly under Socialism it is to be expected that manual workers would work better than to-day; they would not be so discontented and inclined to strike under a system in which the national income was more evenly distributed. For if they struck for higher wages than was reasonable they would not as they do to-day have the support and sympathy of all other unions against their common enemy the employer. This argument is not met by pointing out that in nationalized industries strikes are as frequent than in others, for the essence of the contention is that the workers would be more contented if the national income were more equally divided, and this is not brought about merely by the nationalization of a few industries. Moreover if the fear of unemployment were removed, the workmen would not be so inclined to go slow with their work to prevent their job coming to an end, or to oppose the admission of more people into their trade. To-day every increase in the power of trade unionism means more industrial strife and more limitation of output by the workers. As the workers get more educated they get more discontented and Socialism is the only way I see of avoiding this trouble.

I might perhaps mention that I think industry might be much more efficiently run by the State if certain improvements were made in the British Constitution and other more detailed recommendations contained in Mr. and Mrs. Webb’s «Constitution for the Socialist Commonwealth of Great Britain» carried out.

I turn now to the second question I proposed to consider, the effects of Socialism on the distribution of income. In the first place it is clear that these might not be at all large; the assumption by the State of the ownership of industry, by buying out the existing owners, does not necessarily change the distribution of income very much; it would render it impossible for any further fortunes to be made in industry but would not reduce existing fortunes or the incomes derived from them. This, if desired, could be accomplished by taxation. But it is reasonable to suppose that a Socialist State would take measures to distribute the national income more equally, as the pressure of public opinion would be in that direction; and this is the great advantage which most of its supporters see in Socialism. I am now going to consider whether it would really be an advantage; or, more generally, what is the most desirable method of distributing the national income.

I shall begin with the two arguments which seem to me conclusive in favour of an approximately equal distribution. First there is the economic argument from the law of diminishing marginal utility, or non-technically that if incomes are unequal, the less urgent needs of the rich take precedence of the more urgent needs of the poor, and that therefore the aggregate happiness is increased by taking money from the rich and giving it to the poor. This argument must of course be qualified by allowing that men differ in their capacity to make good use of money; and if there were a reliable way of ascertaining such differences between men and adjusting their incomes to correspond, it would clearly be a good thing to do this. But I do not think that this qualification could be used to justify any bachelor having more than £ 500 a year at the outside.

Secondly there is the social argument in favour of equality of income; that only so can we avoid the existence of more or less hereditary social classes. The disadvantages of a class system are firstly that it restricts equality of opportunity, which is not only unjust but injurious to the community, as it implies that certain skilled jobs are given to unnecessarily incompetent people; and secondly that it limits the range of sexual and social selection.

Supposing then that the national income is to be nearly equally distributed, we may notice some minor exceptions which should be made. If of two occupations one is more unpleasant, then, other things being equal, that one should be more highly remunerated. Also a man should be able to save and leave to his family a moderate amount of money; and it would probably be wise to encourage this by paying interest on such savings.

A more important and difficult question is the remuneration of skilled brain work; about it I can think of three points. First that unless it is more highly paid than ordinary work it is not likely to be done as well as it might be; but secondly that as it is more interesting than ordinary work it ought on that account to be paid less; thirdly that those who are capable of skilled brain work are perhaps more likely to make good use of money and leisure than are others and that therefore they should be given more. The conclusion I come to is that such people should have larger but not very much larger incomes than the rest of mankind.

Lastly there is the question whether the cost of a family should be born by the father or the State. On the one hand it seems reasonable that those who enjoy the pleasure of having children should bear the cost for it themselves; but on the other hand the principle of making the national income go as far as possible makes reasonable leads towards the maintenance of the children by the State. Evidently the misery of poverty would to-day be considerably alleviated if incomes were proportioned to the size of the family; and this plan is in fact adopted in poor relief and government pensions and separation allowances. The chief objection to it to-day is that it would probably tend to increase the population; but whether that objection will maintain its force when people know about birth control and are educated enough to practise it seems to me Very doubtful. From the eugenic point of view might of course be advisable to encourage by a bounty those who reach a certain standard of intelligence to have children.

MISCELLANEOUS NOTES ON PROBABILITY

19 Dic

Gerione_1Propongo la traduzione di un  breve appunto di Frank Ramsey riguardante alcune osservazioni sulla della teoria della probabilità. La nota è stata pubblicata dalla prof.ssa Maria Carla Galavotti in Notes on Philosophy, Probability and Mathematics ed. Bibliopolis. Al termine riporto il testo in lingua originale.

NOTE VARIE  SULLA PROBABILITÀ

Marzo 1928

I. Ci sono 4 collegamenti tra il grado di convinzione e frequenza:

( 1) se il grado di convinzione = λ, la frequenza più probabile è λ ( se gli avvenimenti indipendenti) . Questo è il teorema di Bernoulli

( 2) se la frequenza è stata λ tendiamo a credere il grado di convinzione λ

( 3) se la frequenza è λ , il grado di convinzione λ è giustificato.

Questa è la definizione di Peirce

( 4) Il grado di convinzione λ significa agire in modo appropriato ad una frequenza λ. E’ quest’ultima che determina il calcolo delle frequenze applicabili ai gradi di cconvinzione.

II . Se invio una lettera e non ottengo alcuna risposta, la lettera persa potrebbe essere quasi con la stessa probabilità o la risposta o la mia, ma in molti casi raramente penso a questo, per un senso di colpa.

III . E’ istruttivo confrontare i casi dei dadi e i casi di morte (cfr. in particolare Bosanquet1).

1 Cfr. B. Bosanquet, Logic, Oxford, 1888, 2a ed. 1911.

1/6 delle facce del dado sono : : : ∴ la faccia descritta = quella che cadrà la prossima volta ha la probabilità 1/6 di essere : : :

1/40 di uomini sono morti l’anno scorso ∴  le persone descritte = quello che ho assicurato due anni fa ha la probabilità di 1/40 di essere morto.

Le differenze sono:

(1) nel primo caso la descrizione è più spesso soggettivamente irrilevante rispetto al secondo

( 2 ) nel secondo caso l’induzione al prossimo anno è molto più incerta che nel primo caso a morire nel tempo di un minuto.

IV . C’è una difficoltà sia nella teoria Keynes sia nella mia in materia di descrizioni. “Questa urna contiene 3 volte di più palline bianche che palline nere” ∴ la probabilità che la palla estratta sia bianca è 3/4.

Difficile rendere questo come risultato di un calcolo di funzione vera da proposizioni ugualmente probabili.

Questo è il testo in lingua originale:

MISCELLANEOUS NOTES ON PROBABILITY

March 1928

I. There are 4 connections between degree of belief and frequency:

(1) if degree of belief = λ, most probable frequency is λ (if instances independent). This is Bernoulli’s theorem

(2) if frequency has been λ we tend to believe with degree λ

(3) if frequency is λ, degree λ of belief is justified.

This is Peirce’s definition

(4) degree λ of belief means acting appropriately to a frequency λ. It is this last which makes calculus of frequencies applicable to degrees of belief.

II. If I send a letter and get no answer, the lost letter is almost as likely to be the answer as mine, but in many cases I rarely think of that, from a feeling of guilt.

III. It is instructive to compare dice and deaths (see especially Bosanquet 1).

1 See B. Bosanquet, Logic, Oxford, 1888, 2nd ed. 1911.

1/6 faces of die are 2 : : :  ∴ described face = that which will fall next is 1/6 likely to be : : :

1/40 men died last year   ∴ described man = the one I insured two years ago is 1/40 likely to be dead.

Differences are (1) in first case description is more often subjectively irrelevant than in second

(2) in second case the induction to next year is much more precarious than that in first case to die in a minute’s time.

IV. There is a difficulty both on Keynes’ theory and on mine in regard to descriptions. “This urn contains 3 times as many white as black balls”  ∴ probability ball drawn is white is 3/4.

Difficult to make this a result of a truth function calculation from equally probable  propositions.

CRITICISM OF KEYNES

19 Dic

Schermata 44Propongo la traduzione di un  breve appunto di Frank Ramsey riguardante la critica ad alcuni punti della teoria della probabilità di J.M. Keynes. La nota è stata pubblicata dalla prof.ssa Maria Carla Galavotti in Notes on Philosophy, Probability and Mathematics ed. Bibliopolis. Al termine riporto il testo in lingua originale.

CRITICA A KEYNES

H.W.B. Joseph, Mr. Keynes sulla probabilità, Mind 1923 1.

1 Vol. 32, pp. 408-432.

Il punto principale: che gli oggetti delle nostre convinzioni non sono proposizioni, e che non esistono tali rapporti oggettivi tra di loro.

R.H. Nisbet, I Fondamenti della Probabilità, Mind 1926 2 .

2 Vol.  35, pp. 1-27 .

Il Principio di Indifferenza poggia sui giudizi di irrilevanza.

I giudizi di irrilevanza poggiano su esperienze di frequenza o su che cosa?

Le sue leggi della probabilità non hanno prove, e le sue procedure simboliche mascherano la portata delle sue ipotesi.

F.P. Ramsey.

Non esistono questi oggetti come queste relazioni.

( a) Davvero noi le percepiamo? Meno che mai nei casi più semplici quando dovrebbero essere più evidenti; possiamo davvero conoscere così poco, eppure essere così certi delle leggi che le soddisfano? (Quello che pensiamo è ciò che vorremmo credere).

Tutte le altre relazioni logiche sono facilmente descrivibili, noi abbiamo bisogno della loro presenza perché sia vero un giudizio preciso, ma tutto quello che abbiamo da giudicare è che qualcosa è un esempio di una regola. Qui non ci sono regole; il Principio di Indifferenza di Keynes non è tale (a causa di irrilevanza), anche se appare così, mentre invece non lo è.

( b) Esse dovrebbero essere veramente i rapporti tra proposizioni e questi oggetti non ci sono.

( c) Dovrebbero porsi in una qualche strana corrispondenza con i gradi di convinzione.

( d ) Keynes non può nemmeno mantenere il proprio punto di vista; si attiene ad un punto di vista molto diverso andando avanti; che le varie relazioni osservabili giustificano diversi gradi di convinzione.

( e) In che senso li giustificano? Questo è più vicino al vero che può significare solo che la maggior parte di esse portano dalla verità alla verità altrimenti alla magra consolazione di essere sempre giustificati nell’errore .

( f) Ma la giustificazione non è solo materia di relazioni logiche confronta Keynes su Fermat: non capisce i suoi stessi principi.

Questo è il testo in lingua originale:

CRITICISM OF KEYNES

H.W.B. Joseph, Mr. Keynes on Probability, Mind 1923 1.

1 Vol. 32, pp. 408-432.

Main point that the objects of beliefs are not propositions, and that there are no such objective relations between them.

RH. Nisbet, The Foundations of Probability, Mind 1926 2.

2 Vol. 35, pp. 1-27.

Principle of indifference rests on judgments of irrelevance.

Judgements of irrelevance rest on experience of frequency or what?

His laws of probability have no evidence, and his symbolic procedure masks the extent of his assumptions.

F.P. Ramsey:

There are no such things as these relations.

(a) Do we really perceive them? Least of all in the simplest cases when they should be clearest; can we really know them so little and yet be so certain of the laws which they satisfy? (What we do think of is what we would believe).

All other logical relations are easily describable, we need it is true a direct judgment of their presence, but all we have to judge is that something is an instance of a rule. Here there are no rules; Keynes Principle of Indifference is not such (owing to irrelevance) even if it is sound, which it is not.

(b) They would have to be relations really between propositions and there are no such things.

(c) They would stand in such strange correspondence with degrees of belief.

(d) Keynes can’t even keep to his own view; quite different view keeps coming through; that various observable relations justify different degrees of belief.

(e) In what sense justify? This is nearer the truth it can only mean that they mostly lead from truth to truth otherwise poor consolation of being always justified in error.

(f) But justification is not matter of logical relations only cf. Keynes on Fermat he does not understand his own principles.

ON THE HYPOTHESIS OF LIMITED VARIETY

19 Dic

Pacioli_2Propongo la traduzione di un appunto di Frank Ramsey riguardante l’ipotesi di varietà limitata con una critica alle tesi di J.M. Keynes sullo stesso argomento della teoria del calcolo probabilistico. La nota è stata pubblicata dalla prof.ssa Maria Carla Galavotti in Notes on Philosophy, Probabilitity and Mathamatics ed. Bibliopolis. Al termine riporto il testo in lingua originale.

SULL’IPOTESI DI VARIETÀ LIMITATA 1

Ottobre 1922

1 Si noti che  in questo saggio viene adottata la notazione  di Keynes. Pertanto, g/Hn sta per “la probabilità di g nell’ipotesi Hn“. Per quanto riguarda l’”Ipotesi di Varietà limitata” vedere J.M.Keynes, A Treatise on Probability, London: MacMillan, 1921, in particolare il cap. 22. Vedi anche il giudizio su questo libro di Ramsey in The Cambridge Magazine 11 (1922), pp. 3-5 , ristampato in British Journal for the Philosophy of Science 40 (1989), pp. 219-222.

Questa per prima cosa necessita di una correzione per renderla non equivalente al contraddittorio assioma dell’Infinito, che sarebbe inutile del tutto nell’induzione. (Questa osservazione accetta l’ Assioma di riducibilità). Per fare questo bisogna limitare le proprietà, a cui si applica, a quelle di un certo tipo, a cui quelle della nostra induzione(φ, f) devono appartenere, e a cui devono appartenere quelle delle analogie che si verificano in positivo e in negativo nei nostri esperimenti.

Poi propongo di metterla nella seguente forma che  probabilmente non è esattamente quella di Keynes, ma non sostanzialmente diversa da quella, ma più naturale e suscettibile di calcolo.

“Ogni proprietà di un dato tipo è equivalente in estensione ad alcune combinazioni logiche (funzione vere) di un numero finito di proprietà generatrici”.

Chiamerò questa ipotesi H. H insieme con l’affermazione che il numero di proprietà generatrici è n, la chiamerò Hn.

Keynes afferma che H determina una probabilità finita per g, la nostra generalizzazione φ x ⊃x fx , giustificherebbe così l’induzione pura. Questo lo nego e non riesco ad ammettere che tutto quello che dice lo dimostri; e credo che lo asserisca solo perché confonde H con Hn . Perché Hn determina una probabilità finita per g, se facciamo una certa applicazione del Principio di Indifferenza che Keynes sembra considerare come legittimo. Se ci sono n generatori di proprietà il numero di combinazioni di esse che un oggetto può avere è N = 2n.

Quindi l’estensione ad Hn di qualsiasi adatta proprietà deve consistere di un certo numero di classi N (o sarebbe nulla) . Quindi le estensioni di φ , f possono essere scelte in 2N ⋅ 2N = 4N modi e  3N di queste saranno quelle di f che includono quelle di φ. Quindi g/Hn = (3/4)N finito per qualsiasi n.

Ma non possiamo concludere da questo che g/H è finito, anche se potrebbe se g/ Hn fosse stato > ε > 0 per ogni n; perché allora dovremmo avere anche g/H> ε; ma g/Hn → 0 per n → ∞ così l’inferenza non sarebbe possibile.

Questo porta a termine l’unico metodo che posso considerare che dimostri che H sarebbe di qualche utilizzo in una qualunque induzione. Ma Hn si considera essere molto utile nell’esaminare più delle sue conseguenze.

Vedremo che ciò giustifica una regola che somiglia alla Regola di Laplace delle Successioni, e il metodo di ragionamento dall’analogia come esposta da Keynes.

La regola di successione dedotta da Hn.  φ , f supposti semplici. Se p di φ ha  dimostrato  f, richiede che  le probabilità che  una p + 1a ci sarà, e che tutte le φ sono f (p ≥ 1)

Ci sono N classi che devono essere prese nel loro insieme o lasciate nel formare l’estensione di una qualche proprietà.

Se p di Φ sono f; allora  r classi, essendo entrambe sia φ sia f, possono essere scelte in

Schermata 2013-12-02 alle 21.52.11

modi, le p distribuite tra queste in pr modi e le restanti N – r classi divise in φ Schermata 2013-12-02 alle 21.56.47     , f   Schermata 2013-11-09 alle 20.44.22Schermata 2013-12-02 alle 21.56.47 Schermata 2013-11-09 alle 20.44.22                  in 3N -r modi.

∴ il numero dei casi consentiti dalla ” p di φ che sono f ” è

Schermata 2013-12-02 alle 22.00.58 traduzione

∴ la probabilità che la p + 1th  φ  sia un f è

Schermata 2013-12-02 alle 22.08.08

e questa è la regola della successione. Ciò aumenta con p e → 1 per p → ∞ .

Extra – casi  di p + 1th potrebbero esserci per ipotesi in qualsiasi classe.

Il numero dei casi consentiti dalla ” p di φ sono di f ” ” tutti i φ sono f” si vede da un calcolo simile al precedente (unica differenza solo f  Schermata 2013-11-09 alle 20.44.22   ,  Schermata 2013-11-09 alle 20.44.22Schermata 2013-12-02 alle 21.56.47  ,   non φ Schermata 2013-12-02 alle 21.56.47   )  sarebbe φ (N,2 ,p ).

∴ La probabilità che tutti i φ sono f è

Schermata 2013-12-02 alle 22.07.39

aumenta anche con p e → 1 per p → ∞ .

Quindi Hn è sufficiente per giustificare la generalizzazione per pura induzione.

Inoltre è sufficiente a giustificare i metodi di analogia. Per una analogia supplementare positiva tra i nostri casi dà una probabilità che questi  sarebbero limitati a meno delle N classi che una distribuzione normale darebbe, e le analogie negative hanno l’effetto contrario. Dobbiamo naturalmente supporre N grande in confronto al numero di osservazioni che siamo in grado di fare .

Ma Hn non fornisce alcun sostegno al Metodo della Differenza di Mill.

Questo metodo consiste nell’osservare due casi uno dei φ f , un altro di  Schermata 2013-11-09 alle 20.44.22 Schermata 2013-12-02 alle 21.56.47      (entrambi i quali supportano φ ⊃ f), e immaginando che la loro influenza favorevole aumenta se questi casi concordano, a parte f, φ, per quanto possibile; questo è il metodo di variare un fattore alla volta . Ma per Hn l’unico modo che le somiglianze e le differenze tra i nostri esempi determinano è di alterare la loro probabile distribuzione fra le N classi, che è sempre aumentata dalle differenze, e diminuita dalla concordanza, tra i vari casi, se questi sono di φ f , o Schermata 2013-11-09 alle 20.44.22 Schermata 2013-12-02 alle 21.56.47  .

Possiamo notare che per la validità di una pura correlazione induttiva cioè per ottenere g/n finita, abbiamo solo bisogno Hn/n finito per qualche n; ma questo ovviamente non è il caso per la giustificazione degli altri metodi, che sembrano aver bisogno dell’assunzione assoluta di alcuni Hn .

Ma questo non è davvero così dovuto a causa della possibilità di rafforzare un’ipotesi induttiva con l’esperienza, sottolineata da Keynes . Questo possiamo stabilire con un argomento più semplice di quello di Keynes e formalmente rigoroso. Questo.

Sia H un ipotesi induttiva ; h la nostra totale conoscenza.

Supponiamo q sia un evento previsto per induzione cioè q / Hh  > q / h .

Dividiamo ciascun membro per qH / h

∴ H / h < H / qh cioè q che ne esce rafforza la probabilità di H.

In conclusione sembra che la necessità di sostituire alcuni Hn con H fa sembrare l’intera questione incredibilmente arbitraria.

Né alcun sostegno si potrebbe trarre dal presunto collegamento di H con l’Ipotesi dell’Uniformità Atomica, perché questa sembra meno una premessa per l’induzione, che un fatto sulla natura (scoperto per induzione ), da cui dipende non la ragionevolezza dell’induzione, ma la sua utilità pratica .

Anche l’induzione sarebbe molto più soddisfacentemente giustificata da un principio induttivo che da una ipotesi induttiva. Il dire che coloro che usano l’induzione sono ragionevoli perché conoscono inconsciamente alcune grandi realtà della natura, necessariamente molto complicate, come dimostra il fallimento di tutti i tentativi di formularle, è appena sufficiente. Sarebbe molto meglio capire che il procedimento induttivo è ragionevole in se stesso, in virtù di qualche principio probabilistico, con la posizione logica del Principio di Indifferenza. Ma come affermare questo ignoto Principio Induttivo è una questione molto difficile.

Questo è il testo in lingua originale:

ON THE HYPOTHESIS OF LIMITED VARIETY1

October 1922

1 Note that Keynes’ notation is adopted throughout this essay. Accordingly, g/Hn stands for “the probability of g on hypothesis Hn”. As to the “Hypothesis of Limited Variety” see  Keynes, A Treatise on Probability, London: MacMillan, 1921, especially Ch. 22. See also the review of this book by Ramsey in The Cambridge Magazine 11 (1922), pp. 3-5, reprinted in British Journal for the Philosophy of Science 40 (1989), pp. 219-222.

This first needs amendment to make it not equivalent to the contradictory of the Axiom of Infinity, which would be no use in Induction at all. (This remark assumes the Axiom of Reducibility). To do this we must limit the properties, to which it is to apply, to those of a certain kind, to which those of our induction (φ, f) must belong, and to which those of the analogies positive and negative occurring in our evidence should belong.

Next I propose to state it in the following form probably not exactly that of Keynes, but not seriously different from it, and more natural and amenable to calculation.

“Every property of the given kind is equivalent in extension to some logical combination (truth function) of a finite number of generator properties”.

This hypothesis I shall call H. H together with the assertion that the number of generator properties is n, I shall call Hn.

Keynes asserts that H gives a finite probability to g, our generalisation φ x ⊃x fx, and so justifies pure induction. This I deny and I cannot see that anything he says supports it; and I believe he only asserts it because he confuses H and Hn. For Hn does give a finite probability to g, if we make a certain application of the Principle of Indifference which Keynes appears to regard as legitimate. If there are n generator properties the number of combinations of them an object can have is N = 2n.

Hence on Hn the extension of any suitable property must consist of a certain number of N classes (or be null). Hence the extensions of φ, f can be chosen in 2N ⋅ 2N = 4N ways and in 3N of these will that of f include that of φ. Hence g/Hn = (3/4)N finite for all n.

But we cannot conclude from this that g/H is finite, though we could do so if g/Hn was > ε > 0 for all n; for then we should have g/H > ε also; but g/Hn → 0 as n → ∞ so the inference is not possible.

This closes the only method I can see of showing that H would be any use in induction whatever. But Hn is seen to be very useful by examining more of its consequences.

We shall see that it justifies a rule resembling Laplace’s Rule of Succession, and the method of reasoning from analogy as expounded by Keynes.

Rule of succession deduced from Hn . φ, f supposed simple. If p φ’s have proved f’s, required the chances that a p + 1th will, and that all φ’s are f’s (p ≥ 1)

There are N classes which must be taken as a whole or left in forming the extension of any property.

If p φ’s are f’s; then r classes, to be both φ’s and f’s, can be  chosen in

Schermata 2013-12-02 alle 21.52.11

ways, the p distributed among them in pr ways and the remaining N-r classes divided into φ  Schermata 2013-12-02 alle 21.56.47   , f   Schermata 2013-11-09 alle 20.44.22   ,  Schermata 2013-12-02 alle 21.56.47 Schermata 2013-11-09 alle 20.44.22      in 3N-r ways.

∴ the number of cases allowed by “p φ’s are f’s” is

Schermata 2013-12-02 alle 22.00.58

∴ the probability that the p + 1th  φ  is an f is

Schermata 2013-12-02 alle 22.08.08

and this is the rule of succession. This increases with p and → 1 as p → ∞.

Extra-cases p + 1th may be on hypothesis in any class.

The number of cases allowed by “p φ’s are f ’s” “all φ’s are f’s” is seen by calculation similar to the above (only difference only  f  Schermata 2013-11-09 alle 20.44.22     ,   Schermata 2013-12-02 alle 21.56.47 Schermata 2013-11-09 alle 20.44.22      not φ   Schermata 2013-12-02 alle 21.56.47   ) to be φ (N, 2, p).

∴ Probability that all φ’s are f’s is

Schermata 2013-12-02 alle 22.07.39

also increases with p and → 1 as p → ∞.

Hence Hn is adequate to justify generalisation by pure induction.

Further it is adequate to justify the methods of analogy. For extra positive analogy among our instances gives a probability that they are confined to fewer of the N classes than a normal distribution would give, and negative analogies have the contrary effects. We must of course suppose N large in comparison with the number of observations we are able to make.

But Hn yields no support to Mill’s Method of Difference.

This method_consists in observing two instances one of φ f, another of  Schermata 2013-11-09 alle 20.44.22 Schermata 2013-12-02 alle 21.56.47   (both of which support φ ⊃ f) and imagining that their favourable influence is heightened if these instances agree, apart from f, φ as far as possible; it is the method of varying one factor at a time. But on Hn the only way that resemblances and differences between our instances matter is by altering their probable distribution among the N classes, which is always increased by differences, and decreased by agreements, between the instances, whether these are of  φ f, or of   Schermata 2013-11-09 alle 20.44.22 Schermata 2013-12-02 alle 21.56.47 .

We may notice that for the validity of pure inductive correlation i.e. to get g/n finite, we only need Hn/n finite for some n; but this is not obviously the case for the justification of the other methods, which appear to need the absolute assumption of some Hn

But this is not really so owing to the possibility of strengthening an inductive hypothesis by experience, pointed out by Keynes. This we can establish by an argument simpler than that of Keynes and formally rigorous. Thus.

Let H be an inductive hypothesis; h our total knowledge.

Suppose q to be an event foretold by induction i.e. q/Hh > q/h.

Divide each side into qH/h

 ∴ H/h < H/qh i.e. q coming off strengthens the probability of H.

In conclusion it seems that the necessity of substituting some Hn, for H makes the whole thing seem impossibly arbitrary.

Nor can any support be drawn from the supposed connection of H with the Hypothesis of Atomic Uniformity, because this seems less a premiss in induction, than a fact about nature (discovered by induction) on which depends not the reasonableness of induction but its practical utility.

Also induction would be far more satisfactorily justified by an inductive principle than by an inductive hypothesis. To say that those who use induction are reasonable because they know subconsciously some big fact about nature, necessarily very complicated, as is shown by the failure of all attempts to formulate it, is hardly good enough. It would be far better to make out that inductive procedure is reasonable in itself, in virtue of some principle of probability, with the logical status of the Principle of Indifference. But how to state this unknown Inductive Principle is a matter of great difficulty.

ON THE NATURE OF LOGIC

4 Ott

Schermata 2013-09-30 alle 10.33.25Propongo la traduzione di un appunto di Frank Ramsey pubblicato in lingua originale dalla prof.ssa Maria Carla Galavotti nel libro Notes on philosophy, probability and mathematics ed. Bibliopolis.

Al termine riporto il testo in lingua originale.

SULLA NATURA DELLA LOGICA

(1) J. N. Keynes

La Logica scienza che studia i principi generali del pensiero legittimo; soprattutto le condizioni che giustificano il passaggio da giudizio a giudizio.

La Normativa come Etica Estetica.

La logica è formale in quanto non si interessa delle differenze tra gli oggetti su cui noi ragioniamo, ma solo delle differenze nel nostro modo di pensare.

La Forma una questione di grado; nella logica l’identità di forma dipende dal grado di analisi. La logica formale le parti più astratte.

Il Linguaggio uno strumento necessario del pensiero che non possiamo ignorare.

La Psicologia tratta dell’origine delle nostre credenze logiche con validità.

L’Utilità della logica è nel soddisfare la curiosità come ogni altra scienza.

(2) W.E. Johnson

La logica è l’analisi e la critica del pensiero. Confine vago.

Il pensiero comprende il giudizio percettivo ((aggiunto: ma non l’esperienza sensoriale)), in quanto coinvolge attività controllate dallo scopo di raggiungere la verità.

Questo l’unico scopo del pensiero.

La logica non è una tecnica di pensiero.

Come Etica Estetica ma non dubbia.

La grammatica subordinata alla logica come un linguaggio volto a riflettere la struttura del pensiero.

(3) H.W. B. Joseph

La logica è scienza del pensiero, vale a dire studia i principi universali  in base ai quali pensiamo.

Le scienze il suo migliore materiale le conoscenze.

La logica come tutte le scienze che si occupano di forma cioè ciò che è comune a molte cose; ma non ciò che è comune al pensiero riguardo ad ogni cosa. Il significato di “è” in “S è P” dipende dalla natura di S e P [questo è solo perché la lingua è così inesatta].

La logica non un’arte ma per raccontarci cosa è la conoscenza che non ci aiuta nemmeno un po’ 1.

1 Cfr. J.N. Keynes, Studies and Exercises in Formal Logic Including a Generalization of Logical Processes in their Application to Complex Inferences, Londra, 1884, 4a ed. Londra-New York, 1906; W.E. Johnson, Logic, cit,. H.W. B. Joseph, An Introduction to Logic, Oxford, 1906, 2a ed. 1916.

E questo è il testo originale:

ON THE NATURE OF LOGIC

  1. J. N. Keynes

Logic science which investigates the general principles of valid thought; especially conditions which justify passing from judgment to judgment.

Normative like Ethics Aesthetics.

Logic is formal in so far as not concerned with the differences between the objects about which we think but only about differences in our manner of thinking.

Form a matter of degree; in logic identity of form depends on degree of analysis. Formal logic the more abstract parts.

Language a necessary instrument of thought which we cannot disregard.

Psychology deals with origin of our beliefs logic with validity.

Utility of logic is in satisfying curiosity like any other science.

(2) W.E. Johnson

Logic is analysis and criticism of thought. Vague boundary.

Thought includes perceptual judgment ((added: but this not sense experience)) as it involves activity controlled by purpose of attaining truth.

This sole purpose of thought.

Logic not a technique of thought.

Like Ethics Aesthetics but no controversial.

Grammar subordinate to logic as language intended to reflect structure of thought.

(3) H.W. B. Joseph

Logic science of thought, i.e. studies general principles in accordance with which we think.

Sciences his material best knowledges.

Logic like all sciences concerned with form i.e. what is common to many things; but not what is common to thought about everything. The meaning of is in S is P depends on nature of S and P [this is only because language is so bad].

Logic not an art but by telling us what is knowledge what not helps us a bit 1.

1 See  John Neville Keynes, Studies and Exercises in Formal Logic Including a Generalization of Logical Processes in their Application to Complex Inferences, London, 1884, 4th ed. London-New York, 1906; W.E. Johnson, Logic, cit.; H.W. B. Joseph, An Introduction to Logic, Oxford, 1906, 2nd ed. 1916.

PROPOSITIONAL FUNCTIONS AND PROPOSITIONS ARE BOTH SYMBOLS

30 Set

Come si suonano gli elettoriPropongo la traduzione di un appunto di Frank Ramsey riguardante la logica proposizionale pubblicato in lingua originale dalla prof.ssa Maria Carla Galavotti in Notes on philosophy, probability and mathematics ed. Bibliopolis. Al termine riporto il testo in inglese.

Occorre osservare come venga modificato il concetto di aggettivo e di particolare rispetto alla logica tradizionale (cfr. Lewis Carroll).

FUNZIONI PROPOSIZIONALI E PROPOSIZIONI SONO ENTRAMBE SIMBOLI

Funzioni propositive e proposizioni sono entrambi i simboli.

Russell si è messo in un pasticcio trattando funzioni come simboli, ma le proposizioni non come simboli, (lui li chiama “oggetti” ) p.41 ma non p. 48 (1).

1 Cfr. B. Russell e A.N. Whitehead, Principia Mathematica, Cambridge: Cambridge University Press. Vol. I, Prima edizione 1910.

La parola “funzione ” è davvero fuorviante. Non dobbiamo collegare le funzioni proposizionali e quelle matematiche; per loro l’unica cosa comune è una certa incompletezza che ci porta a simboleggiarle con l’aggiunta di un simbolo illustrativo del tipo che le completerebbe.

Le argomentazioni di Johnson che funzioni propositive e matematiche sono dello stesso tipo sono del tutto superficiali. Egli assimila una formulazione epistemica a una proposizione ad esempio ” φ a è dubbia ” a ” 4 = 2 + 2 ” senza provare a fornire un’analisi soddisfacente di entrambe.

L’ idea fondamentale alla base del concetto di una funzione proposizionale è quella di un’espressione, convenientemente rappresentata da un simbolo di funzione, poiché deve essere completata per fornire una proposizione ed è utile indicare come.

Potremmo dire che la caratteristica essenziale di una funzione è l’incompletezza, non l’ambiguità come dice Russell, che deriva solo da come deve essere completata.

Dal momento che i nomi di particolari devono essere completati per formare una proposizione, la questione si pone perché non li scriviamo anche come simboli di funzione. Vedremo che questo particolare trattamento dei particolari ha una reale giustificazione; questo, tuttavia, non deriva da una differenza reale tra particolari e universali, ma da una limitazione del linguaggio umano .

Un’Espressione (non una proposizione o una operazione ) serve come segno comune di un insieme di proposizioni, di cui vogliamo considerare una qualche funzione di verità, come, ad esempio, che tutte sono vere. L’insieme è l’insieme di proposizioni ottenute completando l’espressione in modo che abbia significato; ma poiché vi è più di un modo possibile di completarle, possiamo ottenere più di un solo insieme.

Così “saggio” ci dà l’insieme delle proposizioni della forma “x è saggio” , e anche il più ampio insieme di tutte le proposizioni, indipendentemente dalla sua forma, che contiene la parola ” saggio “, tra cui ad esempio ” Se Platone dice il vero, Socrate è saggio “. Noi non usiamo “saggio”, ma ” x è saggio ” per indicare il modo in cui completiamo l’espressione al fine di ottenere il set più ristretto di proposizioni, che noi spesso abbiamo occasione di usare ad esempio nel dire ” Alcuni uomini sono saggi “.

Distinguiamo questo insieme più ristretto, come valori di

Schermata 2013-09-30 alle 10.07.04

dal più ampio insieme di valori di

Schermata 2013-09-30 alle 10.09.28

e una distinzione simile è ovviamente necessaria per ogni espressione aggettivale.

Ma se l’espressione è il nome di un particolare noi non facciamo alcuna distinzione del genere; l’unico insieme di proposizioni determinate da “Socrate” è l’insieme di quelle in cui Socrate compare in qualsiasi modo, come i valori di

Schermata 2013-09-30 alle 10.12.51

(Questo è per dire che questo è l’unico di tali insiemi che noi possiamo considerare). Così che non vi è alcuna necessità di utilizzare al posto di Socrate una espressione di funzione come

Schermata 2013-09-30 alle 10.15.24

poiché l’insieme di valori di

Schermata 2013-09-30 alle 10.16.22

sarebbe lo stesso insieme di quello di

Schermata 2013-09-30 alle 10.17.09

o semplicemente

Schermata 2013-09-30 alle 10.17.57.

Abbiamo trovato qui la differenza essenziale tra sostantivo e aggettivo, cioè che nel caso dell’aggettivo formalmente distinguiamo un particolare insieme di proposizioni in cui compare come quelli in cui esso è predicato del soggetto, ma nel caso del sostantivo ogni proposizione in cui essa compare è considerata come predicativo di un aggettivo di esso.

Così in “Socrate è saggio “, ” Platone è saggio ” “saggio” è predicato di soggetti , ma in ” Né Platone né Socrate è saggio ” questo non è il caso, e quest’ultima proposizione non come le altre ci giustificherebbero se dicessimo “Qualcuno è saggio .” Ma ” Platone è saggio “, ” Platone è bello “, ” Platone non è né saggio né bello ” tutti gli aggettivi predicativi di Platone e consentono di affermare ” Platone ha qualche caratteristica “. O come Johnson dice “noi possiamo costruire correttamente un aggettivo composto di  ‘semplici’ aggettivi come possiamo costruire una proposizione composta di ‘semplici’ proposizioni, ma la natura di qualsiasi termine con funzioni di sostantivo è tale che è impossibile costruire un autentico sostantivo composto ” ( Logic Parte II pag. 61) 5 .

5 Cfr. W.E. Johnson, Logic, parte II, cit.

Ma questa differenza tra sostantivi e aggettivi (ovvero parole) non riflette alcuna reale distinzione tra particolari e universali. Perciò se tra gli aggettivi noi abbiamo distinto i nomi di qualità semplici, che non possiamo fare perché non abbiamo tali nomi, e tra le proposizioni in cui ” Socrate ” compare quelle che attribuiscono a lui una semplice qualità ovvero come essere ” elementare ” nel senso di Wittgenstein, allora dovremmo avere un insieme più ristretto di proposizioni che contengono “Socrate”, che potremmo chiamare valori di

Schermata 2013-09-30 alle 10.19.15

E dovremmo distinguere

Schermata 2013-09-30 alle 10.21.58=     ” Socrate ha tutte le caratteristiche” ,  così come noi distinguiamo ” ( x ) . x è rosso = ” tutte le cose sono rosse ” da

Schermata 2013-09-30 alle 10.25.09   = ” essere rosso ha tutte le caratteristiche ” , e sarebbe questo utile per simboleggiare Socrate con la funzione

Schermata 2013-09-30 alle 10.26.23.

Ciò porta all’importante conclusione filosofica che non vi è alcuna reale divisione di oggetti in particolari e universali, ma solo una distinzione di espressioni in sostantivali e aggettivali a seconda delle distinzioni che noi facciamo in relazione a loro.

Questo non vuol dire che non ci sono differenze formali tra gli oggetti, ma solo che non ci sarebbe questa grande dicotomia in particolari e universali .

Questo è il punto di Johnson che una combinazione di aggettivi da’ un vero aggettivo, ma una combinazione di sostantivi non da’ alcun autentico sostantivo. Ma il modo corretto di affermare è che, mentre si distinguono combinazioni di sostantivi dai sostantivi stessi, noi facciamo tale distinzione per gli aggettivi, perché

Schermata 2013-09-30 alle 11.02.30

E’ chiaro che in realtà non ci sono particolari e universali, ma solo oggetti di forme diverse.

Le funzioni di tipo superiore vengono come espressioni per oggetti formali introdotte da una definizione ad esempio ” Predicativo di ”

Schermata 2013-09-30 alle 10.28.56

è una definizione di f non una asserzione come Johnson sembra pensare

utile quando generalizzato, altrimenti superflua.

Questo è il testo originale:

PROPOSITIONAL FUNCTIONS AND PROPOSITIONS ARE BOTH SYMBOLS

Propositional functions and propositions are both symbols.

Russell got into a mess by treating functions as symbols, but propositions not as symbols; (he calls them “objects”) p. 41 but not p. 48 1.

1 See B. Russell and A.N. Whitehead, Principia Mathematica, Cambridge: Cambridge University Press. Vol. I, First Edition 1910

The word “function” is very misleading. We must not connect propositional and mathematical functions; to them the only thing common is a certain incompleteness which leads us to symbolise them by adding an illustrative symbol of the kind that would complete them.

Johnson’s arguments that propositional and mathematical functions are of the same kind are entirely superficial. He assimilates an epistemic statement about a proposition e.g. “φ a is dubious” to “4 = 2 + 2” making no attempt to give a satisfactory analysis of either.

The fundamental idea underlying the notion of a propositional function is that of an expression, conveniently represented by a functional symbol, since it needs to be completed to give a proposition and it is useful to indicate how.

We might say the essential characteristic of a function is incompleteness, not as Russell says ambiguity, which only comes in as to how it is to be completed.

Since the names of individuals must be completed to form a proposition, the question arises why we do not write them also as functional symbols. We shall see that this peculiar treatment of individuals has a real justification; this, however,  does not arise from a real difference between individuals and universals, but from a limitation of human language.

An Expression (not a proposition or an operation) serves as a common mark of a set of propositions, of which we wish to consider some truth – function, as, for example, that all of them are true. The set is the set of propositions obtained by significantly completing the expression; but since more than one way of completing it may be possible, we may get more than one such set.

Thus “wise” gives us the set of propositions of the form “x is wise”, and also the wider set of all propositions, of whatever form, which contain the word “wise”, including e.g. “if Plato tells the truth, Socrates is wise”. We use not “wise” but “x is wise” to indicate the way in which we complete the expression in order to obtain the narrower set of propositions,  which we often have occasion to use e.g. in saying “Some men are wise”.

We distinguish this narrower set as values of

Schermata 2013-09-30 alle 10.33.25

from the wider set of values of

Schermata 2013-09-30 alle 10.34.16

and a similar distinction is obviously required for every adjectival expression.

But if the expression is the name of an individual we make no such distinction; the only set of propositions determined by “Socrates” is the set of those in which Socrates occurs in any way whatever, the values of

Schermata 2013-09-30 alle 10.35.08

(That is to say that is the only such set which we ever consider). So that there is no need to use instead of Socrates a functional expression like

Schermata 2013-09-30 alle 10.36.07

since the set of values of

Schermata 2013-09-30 alle 10.37.37

would be the same set as those of

Schermata 2013-09-30 alle 10.38.31

or simply

Schermata 2013-09-30 alle 10.39.23

We have here found the essential difference between substantive and adjective, namely that in the case of the adjective we formally distinguish a particular set of the propositions in which it occurs as ones in which it is predicated of a subject, but in the case of the substantive any proposition in which It occurs is regarded as predicating an adjective of it.

Thus in “Socrates is wise”, “Plato is wise” “wise” is predicated of subjects, but in “Neither Plato nor Socrates is wise” this is not the case, and this last proposition would not like the others justify us in saying  “Someone is wise”. But “Plato is wise”, “Plato is beautiful”, “Plato is neither wise nor beautiful” all predicate adjectives of Plato and justify “Plato has some characteristic”, or as Mr. Johnson puts it “we may properly construct a compound adjective out of `simple` adjectives just as we may construct a compound proposition out of `simple` propositions, yet the nature of any term functioning as substantive is such that it is impossible to construct a genuine compound substantive” (Logic Part ll p. 61) 5.

5 See W.E. Johnson, Logic, Part II. cit.

But this difference between substantives and adjectives (i.e. words) does not reflect any real distinction between individuals and universals. For if among adjectives we distinguished the names of simple qualities, which we cannot do because we have no such names, and among propositions in which “Socrates” occurs those which ascribe to him a simple quality i.e. such as are “elementary” in Wittgenstein’s sense; then we should have a narrower set of propositions containing “Socrates”, which we could call values of

Schermata 2013-09-30 alle 10.40.58.

And we should have to distinguish

“(q). Socrates is q” = “Socrates has all qualities” from

Schermata 2013-09-30 alle 10.41.55

we distinguish “(x) . x is red = “all things are red” from

Schermata 2013-09-30 alle 10.42.48

would he useful to symbolise Socrates by the function

Schermata 2013-09-30 alle 10.40.58.

This leads to the important philosophical conclusion that there is no real division of objects into particulars and universals, but only a division of expressions into substantival and adjectival depending on the distinctions we make in connection with them.

This is not to say that there are no formal differences between objects, but only that there is not this great dichotomy into individuals and universals.

This is Johnson’s point that a combination of adjectivs gives a genuine adjective, but a combination of substantives no genuine substantive. But the proper way to state it is that while we distinguish combinations of substantives from substantives themselves, we make no such distinction for adjectives because

Schermata 2013-09-30 alle 10.44.11

It is clear that in reality there are not individuals and universals but just objects of different forms.

Functions of higher type come as expressions for formal entities introduced by definition e.g. “predicable of”

Schermata 2013-09-30 alle 10.45.02

is a definition of f not a statement as Johnson seems to think

useful when generalised, otherwise superfluous.

Il significato, la conoscenza, la comprensione del significato nella logica di Ramsey e Wittgenstein

28 Mag

ImmagineL’illustrazione è tratta dalla rivista Ashrae Journal di maggio 2013 (pag. 76) e si riferisce all’articolo di Andy Pearson Direct Talking. L’articolo tratta questioni di definizione nel campo degli impianti di trattamento dell’aria, ma ha interessanti relazioni con i testi di Frank Plumpton Ramsey e di Ludwig Wittgenstein che proponiamo di seguito e riguardanti il significato, la logica proposizionale e, più in generale, le basi della conoscenza.

Si riportano alcuni testi di Wittgenstein nell’ordine temporale in cui (presumibilmente)  sono stati sviluppati ed in rapporto ad alcuni appunti di Ramsey anche per far notare l’influenza chiarificatrice di quest’ultimo sul pensatore austriaco.

La logica proposizionale si occupa di ragionamenti descrittivi, deduttivi ed induttivi.

La descrizione ha il solo scopo di fornire, nel rispetto della logica, l’immagine di un fatto come risulta del mondo soggettivo di un individuo.

La deduzione è una tautologia, quindi non fornisce nuove informazioni rispetto a quanto  espresso nella o nelle proposizioni deduttive.

L’induzione, invece, aggiunge nuove informazioni ai fatti descritti, ma ha la caratteristica di essere potenzialmente fallace e comunque è espressione della psicologia individuale (L. W. Tractatus logico-philosophicus  6.363 – 6.3631; F.P. R. Papers for the Cambridge discussion society – Induction: Keynes and Wittgenstein) ) e può non essere, pertanto, condivisa universalmente.

I testi sono in questo ordine:

Ludwig Wittgenstein: Tractatus logico-philosophicus: 2.013 – 3.203 –  4.024 (significato).

Ludwig Wittgenstein: Tractatus logico-philosophicus: 6.336 – 6.3631 (induzione).

Frank Plumpton Ramsey: Meaning; If meaning is casual; Thought and language.

Frank Plumpton Ramsey: We must beware of scholasticism.

Frank Plumpton Ramsey: Keynes and Wittgenstein .

Ludwig Wittgenstein: Ricerche filosofiche: appunti sul significato: 43, 44, 45, 46.

Ludwig Wittgenstein: Grammatica filosofica: appunti sul significato: 10, 11, 12, 13.

Ludwig Wittgenstein: Osservazioni sulla filosofia della psicologia: 14, 15, 16, 46, 109, 257, 258, 259, 260, 261, 263, 264, 265, 266.

La scelta di questi brani non è esaustiva, per questo si rimanda ai testi originali riportati in bibliografia, ma ha la funzione di dare un’idea di come si sono evoluti nell’ingegneria della conoscenza i concetti di significato, comprendere un significato, conoscenza, mondo esterno ed interiore e, solo nei termini della discussione, la logica proposizionale.

Spero vi saranno persone interessate ad individuare percorsi diversi e, possibilmente, più completi in relazione ai contenuti del pensiero di questi autori (ed altri del settore) al fine di sviluppare questi interessanti argomenti che sono alla base del nostro modo di muoverci, e vivere nel nostro mondo.

Bibliografia:

Ludwig Wittgenstein: Tractatus logico-philosophicus – Traduzione di Amedeo G. Conte – Einaudi Paperbacks 142 – 1993

Frank Plumpton Ramsey: Notes on philosophy, probability and mathematics – Edited by Maria Carla Galavotti – Ed. Bibliopolis – 1991

Ludwig Wittgenstein: Ricerche filosofiche – Edizione italiana a cura di Mario Trinchero – Giulio Einaudi Editore – 1974

Ludwig Wittgenstein: Grammatica filosofica – Edizione italiana a cura di Mario Trinchero – La nuova Italia – 1990

Ludwig Wittgenstein: Osservazioni sulla filosofia della psicologia – Edizione italiana a cura di Roberta De Monticelli – Adelphi edizioni – 1990

Giuseppe Ricci: Osservazioni sui colori . Una applicazione dei principi della teoria della conoscenza di Ludwig Wittgenstein – Aquinas Anno XLII, 1999, Fascicolo 2 pagg. 343 – 352

Tractatus logoco-philosophicus

Le proposizioni riguardanti una prima definizione di significato.

E’ abbastanza agevole ricavare l’aspetto di incompletezza e di potenziale incoerenza delle definizioni, come farà Frank Ramsey:

2.0123 Se conosco l’oggetto, conosco anche tutte le possibilità del suo occorrere in stati di cose.

(Ognuna di tali possibilità deve essere nella natura dell’oggetto.)

Non può trovarsi successivamente una nuova possibilità.

3.203 Il nome significa l’oggetto. L’oggetto è il suo significato («A» è lo stesso segno che «A».)

4.024 Comprendere una proposizione vuol dire saper che accada se essa è vera

(La si può dunque comprendere senza saper se è vera.)

La si comprende se se ne comprendono le parti costitutive.

Tractatus logoco-philosophicus

il ragionamento induttivo

Questi concetti sono stati accettati da Frank Ramsey che li ha anche chiariti negli appunti che potete trovare più avanti.

6.363 Il procedimento dell’induzione consiste nell’assumere la legge più semplice che possa esser accordata con le nostre esperienze.

6.3631 Questo procedimento tuttavia ha una fondazione non logica, ma solo psicologica

E’ chiaro che non esiste ragione di credere che davvero avverrà il caso più semplice

Notes on philosophy, probability and mathematics

Questi sono gli appunti di Ramsey  che hanno certamente contribuito all’evoluzione del pensiero di Wittgenstein sul “significato”.

Significato

Noi (B) supponiamo di studiare lo stato di coscienza di A, che supponiamo a noi noto in ordine di tempo, in modo isolato da tutto il resto. In esso si dovrebbero trovare sensazioni, immagini, ecc. Noi non dovremmo essere in grado di trovare leggi adeguate per prevedere il suo corso soprattutto per quanto riguarda la presenza di sensazioni diverse da quelle del movimento volontario (azioni). Ma potremmo avere più successo nel dedurre le immagini, i sentimenti e le azioni quando le sensazioni si sono avute, e noi dovremmo essere sicuramente in grado di costruire una sorta di psicologia di A. In questo dobbiamo naturalmente utilizzare termini come pensiero e significato, ma come e in quali sensi?

Il fatto di cui si dovrebbe trattare in una tale psicologia è che in questo e questo momento A ha avuto esperienze tali e tali, ad esempio, paura, vedere rosso nel mezzo di questo campo, ecc. Può essere che, come Carnap dice, tutte queste qualità potrebbero e dovrebbero essere definite in termini di rapporti di somiglianza, (questo non è assurdo nella psicologia di A, dove è assurdo è come filosofia di A che è come Carnap la mette in relazione al futuro), ma noi non ce ne occupiamo in questa sede, ma si supponga che tutte tali qualità siano già “costituite” e procedere con la costruzione di pensiero e di significato.

Naturalmente la base dei fatti non si ottiene in modo univoco da questa spiegazione, e molto è ancora da definire; per esempio, quando si parla dell’esperienze di A in tempi diversi, non è chiaro se ci si riferisce al tempo fisico, o ad una serie semplice senza qualsiasi tipo di elasticità nell’equivalenza, o di serie come quella con identica elasticità quando appare uguale ad A. Ma io non credo che queste difficoltà abbiano molta importanza per il nostro scopo presente; e sembra chiaro che le qualità di esperienze disposte in una sorta di serie storiche permettano di dare una base sufficiente per la costruzione di significato, almeno come idea teoretica (e dubito fortemente che qualsiasi ampliamento della base consentirebbe di essere costruito se non come concetto teoretico). Ma come ho già dubitato di questo  dobbiamo chiarirlo mediante ciò che segue.

Se il significato è casuale

Se il significato è casuale, non possiamo dire nulla circa la natura delle cose, le decisioni circa la natura delle cose sono atti di volontà sulla base di anticipazioni di convenienza: o, naturalmente, pasticci senza senso.

Non possiamo davvero immaginare il mondo come identità scollegate, le identità che conosciamo sono nel mondo.

Quello che non si può fare non si può fare e non è una buona idea provare a farlo.

La filosofia deriva dal non comprendere la logica del nostro linguaggio, ma la logica del nostro linguaggio non è quello che pensava Wittgenstein. Le immagini che creiamo noi stessi non sono immagini di fatti.

Noi cambiamo continuamente le nostre definizioni; ad esempio ho un’esperienza di diplopia e mi appaiono  immagini doppie e dico, vedo che non ci sono due candele ma una: ho sbagliato a pensare che ce ne fosse una. Ma secondo la mia vecchia definizione, il dire che era una significava che ne vedevo solo una, quindi non ho potuto sulla base della vecchia definizione dire correttamente che che era una.

Nota: oltre ad anticipare l’importanza dell’accettazione della regola nella definizione di significato, viene anche precisato che le regole, per quanto possano apparire coerenti possono risultare, in particolari aree di applicazione, incoerenti e cioè soggette a contraddizioni.

Questo principio è fondamentale quando si affrontano i problemi della comprensione dei fatti che incontriamo. Infatti in base alla nostra unica (ogni individuo è un unicum) caratteristica fisica del sistema  percettivo ed alla unica nostra esperienza individuale costruiamo immagini personali del mondo che possono anche non essere simili a quelle degli altri uomini. La peculiarità individuale può essere una ricchezza o un problema. Risulta sempre un problema quando viene assunta come “assoluto” non modificabile ed intrinsecamente vera. Questi concetti espressi da F.Ramsey e ripresi da Wittgenstein nelle elaborazioni più tarde mostrano come l’intolleranza è un mezzo per commettere errori e cadere in contraddizione: basta vedere l’esempio della diplopia come proposto da Ramsey in questi appunti.

Ma non si tratta neppure di una scelta di tipo relativistico perché le regole devono essere modificate in caso di necessità, ma siccome richiedono come primitivo presupposto la condivisione con gli altri, non possono essere modificate in base ad interessi personali, ma solo per integrare l’area di applicazione. Si deve comunque restare nell’ambito della convenienza, ma in termini sociali. In caso contrario si tratta di “pasticci senza senso”.

Voglio notare anche che questo paragrafo dimostra l’erroneità del materialismo di Galileo Galilei. Infatti pretendere che le leggi della fisica siano scritte nella natura è un presupporre l’oggettività del nostro metodo di ragionamento induttivo. Le nostre immagini del mondo non sono fatti, sono un elemento da noi creato per rappresentarci il mondo per poterci vivere, non sono il mondo.

Anche questi concetti sono il fondamento della nostra libertà di essere in quanto possiamo creare le immagini e le leggi della fisica, della logica, dell’aritmetica, ecc. che vogliamo. Possiamo solo dire che sarebbe utile che fossero, nei limiti di quello che possiamo vedere, coerenti.

Per poter produrre una immagine esattamente identica ad un elemento del mondo esterno probabilmente dovremmo utilizzare un tempo infinito, se operiamo con il metodo delle successive approssimazioni.

Pensiero e linguaggio

Se non possiamo pensare senza simboli, almeno possiamo pensare senza abbastanza simboli da dare un’adeguata espressione ai nostri pensieri.

Non lo possiamo esprimere fino al momento in cui abbiamo abbastanza simboli.

Non possiamo pensare 100 se non con un simbolo

ed in quel momento non pensiamo realmente a 100, è “il numero che è chiamato cento”

Non possiamo pensare ~ ~ ~ p, noi lo calcoliamo proprio come calcoliamo una frazione continua.

⊦”Non possiamo credere in un nonsenso, oppure ad una contraddizione”.

Può questo davvero essere asserito e in che senso?

(Ovviamente ci si può sentire convinti con una frase senza senso. ‘Questo è usato con “suppositio” (termine di logica classica) o in che altro modo?).

Consideratelo su vari punti di vista del pensiero.

Dobbiamo guardarci dallo scolasticismo

Dobbiamo guardarci dallo scolasticismo.

Ludwig è uno scolastico.

Cosa si intende per scolasticismo appare dal seguente ragionamento sul tempo.

Comprendiamo che “A è prima di B”; quindi abbiamo conoscenza del prima ∴ dobbiamo in alcuni casi percepire che A esiste prima di B ∴ dobbiamo percepire il passato.

Tutto ciò non mi convince. Basti pensare se un essere potrebbe non essere in grado  di parlare come noi facciamo se non percepisse il passato.

In realtà tutto ciò che accade è che abbiamo sensazioni acolutiche (Probabilmente si riferisce agli studi Routledge pubblicati nel 1920 riguardanti la memoria delle sensazioni fisiche quando cessa il contatto dei sensi con l’oggetto della sensazione), ma sbiadite ≠ sparite (come visioni di fantasmi) e anche queste non sono necessarie. Il passato è memorizzato nel cervello: AB ci colpisce in modo diverso da BA; ma è così che fa il telefono automatico.

La logica matematica è scolastica; con quanta difficoltà un bambino impara l’idea del tempo. Molto più ne è necessario che “la conoscenza del prima”, né questo aiuterebbe.

La logica è la regola di un linguaggio quando viene realizzato; il pensiero costruttivo è il fare una lingua.

Il mondo primario di Ludwig non contiene nessun pensiero.

Nota: Evidenzia una contraddizione nel pensiero di L. Wittgenstein: il mondo primario (se inteso come mondo esterno ad un individuo) deve contenere i pensieri delle altre persone altrimenti non saremmo in grado di comprendere quale è l’immagine del mondo degli altri e saremmo impossibilitati a dare un’immagine a gran parte del mondo esterno in quanto dovremmo fare lo sforzo di crearci da noi tutte le immagini del mondo primario. In generale mutuiamo l’immagine degli oggetti esterni non solo dall’esperienza personale, ma spesso e molto di più, da quella degli altri.

Induzione: Keynes e Wittgenstein

Ho intenzione di discutere di una delle più importanti questioni filosofiche, che è di interesse generale e non, credo, difficile da capire. Quello che, tuttavia, è così difficile, tanto che che ho abbandonato il tentativo, è di spiegare le ragioni che sono per me decisive a favore del punto di vista che mi sono proposto, vale a dire che è l’unico compatibile con il resto del sistema di Wittgenstein.

“Il processo di induzione”, dice, “è il processo di assumere la più semplice legge che può essere fatta in armonia con la nostra esperienza. Questo processo, tuttavia, non ha alcun fondamento logico, ma solo psicologico. E’ chiaro che non ci sono motivi per ritenere che il più semplice corso degli eventi avverrà realmente”.

Questo è il punto di vista che voglio difendere, ma comincerò considerando la sola descrizione plausibile di una visione alternativa, della quale sono a conoscenza, e cioè quello di Keynes nel suo Treatise on Probability.

Egli introduce una ipotesi, che egli chiama l’ipotesi di varietà limitata, che è grosso modo che tutte le proprietà delle cose nascono da varie combinazione di assenza o presenza di un numero finito di proprietà fondamentali o generatrici. Egli sostiene che gli assunti di questa ipotesi potrebbero giustificare il nostro attribuire certezza alle loro conclusioni ma che il grado giusto di probabilità approssimerebbe la certezza quante più osservazioni sono state fatte che confermano le conclusioni.

Mi sembra che il suo argomento per l’adeguatezza di questa ipotesi contenga un errore; cioè che non richieda l’ipotesi che la varietà sia limitata, bensì che abbia qualche limite definito. Possiamo giustificare l’induzione supponendo che ci sono solo 1000 generatori di proprietà, o supponendo che ce ne siano solo 5 milioni, ma non è sufficiente supporre semplicemente che siano un numero finito. Spiegare perché penso che questa modifica sia necessaria, non è possibile senza entrare in dettagli difficili.

Ma che io abbia ragione o no, non vedo alcuna ragione logica per credere ad alcuna di tali ipotesi; non sono il genere di cose di cui si può supporre di avere una conoscenza a priori, perché sono complicate generalizzazioni sul mondo che evidentemente potrebbero non essere vere. A questo si potrebbe rispondere che non è necessario supporre di conoscere l’ipotesi per certi a priori, ma solo che ha una probabilità finita a priori. (Può essere spiegato che l’alternativa ad una probabilità finita non è un infinito, ma un infinitesimo, come la probabilità che un cuscino abbia una tonalità di colore definito da un numero infinito di tonalità possibili). Argomenti induttivi avrebbero una certa forza se la probabilità iniziale dell’ipotesi fosse finita, e potrebbe quindi essere applicata alla stessa ipotesi, e quindi la probabilità dell’ipotesi aumenterebbe, il che aumenterebbe anche la forza dell’argomento induttivo. Questo corrisponderebbe alla nostra sensazione che l’induzione derivi la sua validità, almeno in parte, dalla nostra esperienza del suo successo.

Dobbiamo quindi considerare la probabilità a priori di una ipotesi di varietà limitata; come possiamo determinare se è finita? Presumibilmente, mediante ispezione diretta, ma a causa della natura astratta delle ipotesi questo è difficile, mi sembra più facile affrontare la questione se notiamo che, se l’ipotesi ha una limitata probabilità a priori, l’ha così ogni generalizzazione come “tutti i cigni sono bianchi”; questo è davvero l’unico motivo per introdurre l’ipotesi. Se poi si può vedere, come credo che possiamo, che la probabilità a priori di “tutti i cigni sono bianchi” è infinitesimale, così deve essere quello dell’ipotesi di varietà limitata.

Non vedo come procedere ulteriormente senza discutere la natura generale di probabilità; secondo Keynes sussiste tra qualsiasi coppia di proposizioni qualche relazione logica oggettiva, da cui dipende il grado di fiducia che è razionale avere in una delle due proposizioni, se l’altra è già nota. Questa chiara obiettiva teoria è però offuscata dal suo affermare in uno o due passaggi che “la probabilità è relativa in un certo senso ai principi della ragione umana”. Con la parola umana si passa da una nozione puramente logica per una che è, almeno in parte, psicologica, e di conseguenza la teoria diventa vaga e confusa. Keynes cerca di identificare le relazioni logiche tra proposizioni, con quelle psicologiche che esprimono il grado di fiducia che è razionale per gli uomini di intrattenere, con il risultato che le relazioni di probabilità di cui egli parla non possono essere chiaramente identificate, dove la difficoltà nel decidere o no può sempre essere confrontata tra l’uno e l’altro o misurata da numeri.

Tra proposizioni ci sono infatti relazioni logiche, o formali, alcune delle quali ci permettono di dedurre una proposizione dall’altra con certezza, altre solo con probabilità. Per esempio, se p, q sono due proposizioni elementari, ad esempio come asserire fatti atomici, possiamo vedere quale probabilità la proposizione p v q (p o q) dà alla proposizione p nel modo seguente.

Ci sono 4 casi possibili:

p vera e q vera

p vera e q falsa

p falso e q vero

p falsa e q falsa

di queste l’ultima (p falsa e q false) è esclusa dall’ipotesi p v q; dei restanti tre casi p è vera in 2, così p v q fornisce la probabilità 2/3. Tali probabilità sono inevitabilmente numeriche e derivano in maniera chiara e stabilita dalle forme logiche delle proposizioni; e mi sembrano essere le uniche probabilità logiche, e solo loro possono fornire una giustificazione logica per una inferenza.

E’chiaro che non giustificano l’induzione, perché non permettono in nessun modo di dedurre da un insieme di fatti altri fatti interamente distinti da questi; non c’è alcun rapporto formale di questo tipo tra la tesi secondo cui alcuni cigni esaminati sono bianchi e la proposizione che qualche altro cigno è bianco. Questo può essere visto anche prendendo il problema dell’induzione nella forma in cui l’abbiamo lasciato. Abbiamo visto che se l’induzione deve essere giustificata deve esserci una probabilità finita iniziale che tutti i cigni sono bianchi, e questo non potrà essere, a causa del numero infinito di cose che, per quanto ne sappiamo a priori, possono essere cigni neri.

A questa teoria della probabilità si potrebbe probabilmente obiettare, in primo luogo, che è difficile dare applicazione pratica, perché non si conoscono le forme logiche delle complicate proposizioni della vita di ogni giorno; a questo rispondo che può comunque essere una teoria vera, e che questo è supportato dalle contraddizioni alle quali le  applicazioni alla vita quotidiana delle teorie della probabilità quasi sempre portano.

Una seconda obiezione più grave è che essa non giustifica processi come l’induzione, che riteniamo ragionevole, e che deve essere in un certo senso ragionevole o non c’è niente per distinguere il saggio dal folle. Ma vorrei suggerire che il senso in cui sono ragionevoli non necessita che non siano giustificati da relazioni logiche.

Mi sembra che ci sia una qualche analogia tra questa questione e quella del bene oggettivo o intrinseco, in quest’ultima si considera la giustificazione delle nostre azioni, e sono presentate ad un tempo con la semplice soluzione che ciò  si trovi nella tendenza a promuovere il loro valore intrinseco, una misteriosa entità non facile da identificare; se ora ci rivolgiamo alla giustificazione dei nostri pensieri noi abbiamo l’ugualmente semplice soluzione che questa si trovi nel seguire certe relazioni di probabilità logica (egualmente misteriose e difficili da identificare), come le uniche individuabili sono evidentemente inappropriate. Io penso che entrambe queste semplici soluzioni sono errate, e che le vere risposte  non siano in termini di etica o di logica, ma di psicologia: ma qui finisce l’analogia; le azioni sono giustificate se esse sono tali che esse o le loro conseguenze noi o le persone in generale hanno una qualche reazione psicologica come esserne soddisfatti.

Ma non possiamo dare questi casi in giustificazione delle inferenze. Due soluzioni mi sembrano possibili; una, suggerita da Hume, è che le buone deduzioni sono quelle derivanti dai principi dell’immaginazione che sono permanenti, irresistibili ed universali in opposizione a quelle che sono mutevoli, vacue e irregolari. La distinzione tra ragionamento buono e cattivo è quindi la stessa che c’è tra salute e malattia.

L’altra soluzione possibile mi è appena venuta in mente, e poiché sono stanco non riesco a distinguere chiaramente se è ragionevole o assurda. Grosso modo  è che un tipo di deduzione è ragionevole o irragionevole in funzione delle frequenze relative con le quali determina il vero o il falso.

L’induzione è ragionevole in quanto produce previsioni che sono in generale verificate, non a causa di qualsiasi previsione logica, che è generalmente verificata, né a causa di ogni relazione logica tra le sue premesse e conclusioni.

In questa prospettiva possiamo stabilire per induzione che l’induzione è razionale, ed essendo l’induzione ragionevole questo sarebbe un argomento di buon senso.

Ricerche filosofiche – Parte prima

Una prima modifica del concetto di “significato”

43. Per una grande classe di casi- anche se non per tutti i casi- in cui ce ne serviamo, la parola «significato» si può definire così: Il significato di una parola è il suo uso nel linguaggio.

E talvolta il significato di un nome si definisce indicando il suo portatore.

44. Abbiamo detto: la proposizione « Nothung ha una lama affilata » ha un significato anche se Nothung è già in pezzi. Ebbene, accade così perché in questo giuoco linguistico si usa un nome anche in assenza del suo portatore. Ma possiamo immaginare un giuoco linguistico con nomi (vale a dire, con segni che certamente chiameremo ancora « nomi ») in cui i nomi vengono usati solo in presenza del portatore; e quindi possono sempre essere sostituiti dal pronome dimostrativo accompagnato da un gesto ostensivo.

45. Il dimostrativo « questo » non può mai essere privo di portatore. Si potrebbe dire: «Finché c’è un questo, anche la parola “questo” ha significato, sia questo semplice, sia composto». – Ma ciò non trasforma affatto la parola in un nome. Al contrario: – infatti un nome non viene impiegato insieme col gesto ostensivo, ma viene soltanto spiegato grazie ad esso.

46. Ma che faccenda è mai questa, dei nomi che designerebbero

propriamente il semplice? – Dice Socrate nel Teeteto « Se non mi inganno ho sentito dire da qualcuno che degli elementi primi – per esprimermi così – di cui noi e tutte le altre cose siamo composti, non si dà definizione; infatti tutto quello che esiste in sé e per sé si può soltanto designare mediante nomi; di esso non è possibile nessun’altra determinazione, né che è, né che non è . . . Ma ciò che è in sé e per sé si deve . . . denominare senza tutte le altre determinazioni. In tal modo, però, è impossibile dire qualcosa a mo’ di definizione intorno a qualsiasi elemento primo, dal momento che per questo non si dà che la mera denominazione; esso ha insomma soltanto il suo nome. Ma come ciò che si compone di questi elementi primi costituisce esso stesso una formazione composta, così anche le sue denominazioni sono diventate, in questa composizione, un discorso definitorio; l’essenza del quale è infatti la composizione dei nomi» 1

Questi elementi primi erano anche gli ‘individuali’ di Russell, nonché i miei oggetti (Tractatus logico-philosophicus).

1 Teeteto 201e-202b Wittgenstein cita dalla traduzione tedesca di Preisendanz. Il testo originale reca:

‹‹ ἐγὼ γὰρ αὖ ἐδόκουν ἀκούειν τινῶν ὅτι τὰ μὲν πρῶτα οἱονπερεί στοιχεῖα, ἐξ ὧν ἡμεῖς τε συγκείμεθα και τἆλλα, λόγον οὐκ ἔχοι. αὐτὸ γὰρ καθ’ αὑτὸ ἕκαστον ὀνομὰσαι μόνον εἴη, προσειπεῖν δὲ οὐδὲν ἄλλο δυνατόν, οὔθ’ ὡς ἔστιν, οὔθ’ οὐκ ἔστιν· […] δεῖν δὲ […] άνευ τῶν άλλων ἁπάντων λέγεσθαι. νῦν δὲ ὰδὐνατον εἶναι ὁτιου̃ν τῶν πρώτων ῥηθῆναι λόγῳ· οὐ γὰρ εἶναι ἀυτῷ ὰλλ’ ἢ ὀνομάζεσθαι μόνον – ὄνομα γὰρ μόνον ἔχειν – τὰ δὲ ἐκ τούτων συγκείμενα, ὣσπερ αὐτὰ πέπλεκται, οὕτω καὶ τὰ ὀνόματα αὐτῶν συμπλακέντα λόγον γεγονέναι· όνομάτων γὰρ συμπλοκὴν εἶναι λόγου οὐσιαν››

Grammatica filosofica Parte prima

Una ulteriore evoluzione del concetto di “significato” e della comprensione del significato

10 «Capire una parola» può voler dire: sapere come la si usa; essere in grado di applicarla.

«Puoi sollevare questa palla?» – «Sì». Poi ci provo e non ci riesco. Forse dirò: «Mi sono sbagliato. Non ne sono capace». Ma forse: «Ora non posso, perché sono troppo stanco; però quando ho detto di poterlo fare, allora sì che ne ero capace». Analogamente: «Pensavo di esser capace di giocare a scacchi, ma me ne sono già dimenticato»; ma, d’altra parte: «Quando ho detto “ Sono capace di giocare a scacchi”, potevo farlo, ora però mi è scappato tutto di mente». – Ma qual è il criterio per dire che una volta si era capaci di farlo? – Come sapevo di poterlo fare?

– A questo si potrebbe rispondere: «Sono sempre stato capace di sollevare un peso così», «L’avevo sollevato solo un istante prima», «Non molto tempo fa ho giocato a scacchi, e la mia memoria è buona››, «Avevo appena ricapitolato le regole››, e così via. Quella che considero una risposta a quella domanda mi mostrerà in qual modo io usi la parola «potere» [«esser capace››].

Il sapere, il potere, la capacità si vorranno chiamare stati.

Confrontiamo tra loro alcune proposizioni, ciascuna delle quali descrive uno stato in un senso diverso dalle altre.

«Da ieri ho mal di denti.»

«Da ieri mi struggo dal desiderio di vederlo.»

«E’ da ieri che l”aspetto.»

«Da ieri so che verrà.»

«Da ieri so giocare a scacchi.»

Si può dire: «Da ieri so ininterrottamente che verrà»? In quale di queste proposizioni si può inserire sensatamente la parola «ininterrottamente»?

Si chiama il sapere uno «stato» nello stesso senso in cui si parla dello stato di un corpo, di un modello fisico. Dunque anche in senso fisiologico, oppure anche nel senso di una psicologia che parla degli stati inconsci di un modello della mente [Seelenmodell]. E certamente chiunque ammetterebbe una cosa del genere, ma allora dev’essere chiaro che si è usciti dalla regione grammaticale degli «stati consci» per passare in una regione grammaticale diversa. Se la proposizione «Ho un mal di denti inconscio» vuol dire qualcosa come: «Ho un dente cattivo, che non mi fa male», allora posso benissimo parlare del mal di denti inconscio. Ma l”espressione «stato conscio» (nel senso di prima) non sta, con l’espressione «stato inconscio», nel medesimo rapporto grammaticale in cui l’espressione «Una sedia, che vedo» sta con l’espressione: «Una sedia, che non vedo perché sta sotto di me».

Invece di «sapere una certa cosa», possiamo dire: «avere con sé un foglietto su cui quella cosa sta scritta».

Se «capire il significato di una parola» vuol dire conoscere le possibilità grammaticali della sua applicazione, posso chiedere:

«Come faccio allora a sapere subito che cosa intendo con una parola che pronuncio? Perché non posso certo avere in testa, tutto in una volta, l’intiero modo d”applicazione della parola».

Posso avere in testa le possibilità d’applicazione di una parola nello stesso senso in cui il giocatore di scacchi ha in testa tutte le regole del giuoco degli scacchi; ma contemporaneamente anche l’ABC e la tavola pitagorica. Il sapere è il serbatoio ipotetico, da cui scorre l’acqua che vediamo.

11. Non si deve dunque pensare che nel capire, intendere, una parola, si tratti di un atto dell’afferrare la grammatica tutta d’un colpo, per così dire in modo non discorsivo. Quasi come se la s’inghiottisse in un boccone.

È come se nella cassetta degli strumenti del linguaggio mi preparassi gli strumenti per l’uso futuro.

«Posso applicare la parola “giallo” » è analogo a: «Negli scacchi posso muovere il re».

E qui, nel giuoco degli scacchi, possiamo di nuovo trovare il duplice senso della parola «capire». Generalmente chi assista a una partita di scacchi conoscendo il giuoco, di fronte a una mossa del giuoco prova un’impressione [Erlebnis] diversa da quella di chi vi assista senza comprenderlo. (E anche un’impressione diversa da quella di uno che non sappia affatto che si tratta di un giuoco.) Si può anche dire che è la conoscenza delle

regole degli scacchi a distinguere il primo spettatore dal secondo, e dunque anche che proprio grazie alla conoscenza delle regole il primo ha un”impressione del tutto particolare della mossa del giuoco. Ma quest’impressione non è la conoscenza delle regole. Siamo però inclini a chiamar «capire» sia l’una sia l’altra.

La comprensione del linguaggio, quasi come quella del giuoco, appare come uno sfondo, sul quale, soltanto, la singola proposizione acquista significato. – Ma questa comprensione, la conoscenza del linguaggio, non è uno stato di coscienza che accompagni le proposizioni del linguaggio. Neppure quando abbia come conseguenza uno stato così fatto. Anzi, è della medesima specie del capire un calcolo, del padroneggiarlo e dunque dell’essere capaci di moltiplicare.

12. E se si chiedesse: quando sei capace di giocare a scacchi?

Sempre? Oppure mentre dici di esserne capace? Oppure mentre fai una mossa degli scacchi? – E come è strano che l’esser capaci di giocare a scacchi richieda così poco tempo, mentre una partita di scacchi ne richiede uno tanto più lungo!

(Agostino: «Quando misuro uno spazio di tempo?»)

Può sembrarci che in qualche senso del termine le regole grammaticali siano lo sviluppo di ciò che esperiamo [erlebenl] tutto in una volta, mentre usiamo la parola.

Per renderci più chiara la grammatica della parola «capire», chiediamo: quando capiamo la proposizione? – Quando l’abbiamo pronunciata tutta quanta? Oppure mentre la stiamo pronunciando? – Il capire è un processo articolato, così come l’enunciazione della proposizione, e la sua articolazione corrisponde a quella della proposizione? Oppure è inarticolato e accompagna la proposizione come il pedale dell’organo accompagna un

tema?

Quanto ci vuole per capire una proposizione?

E quando capiamo una proposizione per per un’ora cominciamo sempre da capo?

13. Il giuoco degli scacchi è caratterizzato dalle sue regole (dall’elenco delle sue regole). Se definisco il giuoco per mezzo delle sue regole (e lo distinguo dal giuoco della dama), queste regole fanno parte della grammatica della parola «scacchi». Ora,

chi usa sensatamente la parola «scacchi», deve per forza aver in mente una definizione della parola? Certamente, no. – Ne darà una solo se gli chiedono che cosa intende con «scacchi».

Supponiamo ora che io chieda: «Che cosa hai inteso quando hai pronunciato la parola?» – Se l’altro mi risponde: «Ho inteso il giuoco che abbiamo giocato così spesso, ecc., ecc.», allora so che mentre usava la parola non aveva affatto in mente questa definizione; e che la sua risposta non risponde alla mia domanda nel senso che mi dica che cosa «è accaduto in lui» quando ha pronunciato la parola.

Chi interpreta, comprende, un segno in questo e quest’altro senso, fa un passo di un calcolo (quasi di un computo). Fa all’incirca quello che fa quando dà espressione alla sua interpretazione

Con «pensiero» [Gedanke] s’intende un processo psichico particolare che forse accompagna l’enunciazione della proposizione; ma s’intende anche la proposizione stessa, nel sistema del linguaggio

«Costui ha pronunciato questa parola, ma intanto non ha pensato a nulla«. – »Ebbene, io ho pensato a qualcosa». – «E a che cosa?» – «Beh, a quello che ho detto».

All`affermazione «Questa proposizione ha senso» non si può assolutamente chiedere: «Quale?». E così pure, alla proposizione «Questa combinazione di parole è una proposizione» non si può chiedere: «Quale?».

Osservazioni sulla filosofia della psicologia (parte I)

L’evoluzione successiva del concetto di significato e della comprensione del significato.

13. L’inclinazione a usare proprio quella espressione verbale è una caratteristica manifestazione del vissuto.

(E una manifestazione non e un sintomo).

14. Ci sono anche altre manifestazioni di questo vissuto? Non sarebbe immaginabile che le cose si svolgessero così: metto davanti a un tale una intelaiatura di filo metallico, un cubo di vetro, una scatola, ecc., e gli domando: « Quale di queste cose è rappresentata dalla figura? ». E lui risponde: « L’intelaiatura di filo metallico ».

15. Dobbiamo dire, a questo punto, che lui ha visto la figura come una intelaiatura di filo metallico – anche se non ha avuto l’esperienza di vederla ora come una cosa ora come un altra?

16 Immaginiamo che qualcuno domandi: « Una F stampata la vediamo tutti allo stesso modo? ». Ebbene, si potrebbe tentare l’esperimento di mostrare a diverse persone una F facendo la domanda seguente: « In che direzione guarda una F verso destra o verso sinistra? ».

Oppure domandiamo: « Se tu dovessi paragonare una F a un volto di profilo dove sarebbe la fronte e dove la nuca? ».

Ma qualcuno forse non capirebbe queste domande.

Esse sono analoghe a domande del tipo: « Che colore ha per te il suono a? » oppure: « come che ti appare a? Giallo o bianco? ».

Se uno non capisse questa domanda, se la dichiarasse priva di senso, potremmo forse dire che non capisce l’italiano o il significato delle parole « colore », « suono », ecc. ?

Al contrario è quando uno ha imparato a capire queste parole che può reagire a quelle domande ‘comprendendole’ o ‘non comprendendole’

46. Se la formazione dei concetti può essere fondata su fatti di natura (psicologici e fisici), allora la descrizione delle nostre costruzioni concettuali non è, in effetti, una scienza naturale travestita? Non dovremmo quindi, anziché della grammatica, interessarci di ciò che in natura sta alla sua base?

Senza dubbio ci interessa anche la corrispondenza fra la nostra grammatica e fatti molto generali della natura (raramente espressi in parole). Ma il nostro interesse non ricade su queste cause possibili. Noi non facciamo scienza naturale: il nostro scopo non è quello di fare predizioni. E nemmeno ci occupiamo di storia naturale: perché noi i fatti di storia naturale ce li inventiamo per i nostri scopi. [Cfr. PU, p. 230a].

109 Da dove viene il concetto di ‘contenuto’ di un vissuto? Bene, il contenuto del vissuto è l’oggetto privato, il dato di senso, l’‘oggetto’ [Gegenstand] che afferro immediatamente con l’occhio o l’orecchio, ecc., della mente. L’immagine interna. Ma dove c’è bisogno di questo concetto?

256. Naturalmente c”è qualcosa che non va anche nello spiegare che il significato o la sua spiegazione si sono sviluppati da un certo germe. In effetti noi non abbiamo la percezione di una tale crescita; o forse l’abbiamo solo in casi molto rari. E questa spiegazione scaturisce appunto dalla tendenza a spiegare, invece di limitarsi a descrivere.

257. Limitarsi a descrivere è così difficile perché si crede che per comprendere i fatti sia necessario integrarli. E come se uno vedesse uno schermo su cui sono sparse delle macchie di colore e dicesse: così come sono, sono inintelligibili; acquisteranno senso solo se le si integra in una figura. – Mentre quello che io voglio dire è, invece: è tutto qui. (Se lo integri, lo snaturi).

258. Certo che il significato mi è venuto in mente proprio in quel momento! Non adesso, nel momento in cui sto raccontando, né nel tempo trascorso tra i due momenti.

Ecco che cosa si intende di preciso quando si dice che è appunto questo l’uso delle parole « Mi è venuto in mente il significato» («in this so called twentieth century»). [« In questo cosiddetto ventesimo secolo ». In inglese nel testo ]

259. « Il significato non è qualcosa di cui si possa avere un vissuto! ». – Perché no? – Il significato non è un”impressione sensoriale. Ma che cosa sono queste impressioni? Qualcosa come un odore, un gusto, un dolore, un rumore, ecc. ecc. Ma che cos’è “qualcosa come” se la si riferisce a tutte queste cose? Che cos’hanno in comune? Naturalmente non si può trovare una risposta alla domanda sprofondandosi in queste impressioni sensoriali. Si potrebbe però domandare: « A quali condizioni diremmo che uno ha un tipo di impressione sensoriale che a noi manca? ». – Ad esempio, di certi animali

diciamo che hanno un organo che fornisce loro questa e questa percezione, e un tale organo di senso può anche non essere simile a uno dei nostri.

260. Sarebbe concepibile un tipo di percezione sensoriale con cui potremmo afferrare la forma di un corpo solido, l’intera forma e non solo ciò che si può vedere da un punto di vista? Una persona che la possedesse sarebbe in grado, ad esempio, di modellare un corpo in creta senza girargli intorno o tastarlo.

261. Dipende forse dalla molteplicità delle possibili spiegazioni del significato il fatto che del significato non abbiamo un vissuto “nello stesso senso” in cui l”abbiamo di un`immagine visiva?

263. Se a qualcuno è venuto in mente il significato di una parola, ammesso che poi non se lo sia dimenticato, può usare la parola in questo modo. Se a qualcuno è venuto in mente il significato, ora lo sa, e questo venire in mente era semplicemente l’inizio del sapere. Qui non c’è analogia con il vissuto di un’immagine mentale.

264. Ma come stanno le cose se invece dico a me stesso che vorrei chiamare questo (e guardo, magari, una determinata figura) così e così (‘x’)? Posso anche enunciare ad alta voce la definizione ostensiva «Questo si chiama x». Ma, naturalmente, devo capirla anch’io! Cioè devo sapere come, secondo questa tecnica, conto di usare la parola «x». – Se qualcuno mi domanda ad esempio: «Sai come userai la parola?», risponderò di sì.

265. E quando la religione insegna che l’anima può sussistere una volta che il corpo è distrutto? Ciò che insegna lo capisco? Certo che lo capisco – posso farmene svariate rappresentazioni. (Di queste cose esistono anche delle immagini dipinte. E perché un”immagine del genere dovrebbe essere soltanto la riproduzione imperfetta del pensiero enunciato? Perché non dovrebbe svolgere lo stesso servizio che svolgono i nostri

enunciati? E ciò che conta è questo servizio).

266. Ma allora sei un pragmatista? No. Infatti io non dico che un enunciato è vero se è utile.

L’utilità, ossia l’uso, è ciò che dà all’enunciato il suo senso particolare, ed è il gioco linguistico che glielo dà.

E in quanto una regola viene spesso data in modo tale che risulti utile, e gli enunciati matematici sono per essenza affini alle regole, l’utilità si riflette nelle verità matematiche.