Archivio | Coerenza RSS feed for this section

A MATHEMATICAL THEORY OF SAVING

1 Ott

stanleyOccorre chiarire che l’utilità di una decisione è un numero compreso tra 0 e 1 in quanto si definisce come la probabilità di ottenere la conseguenza migliore per effetto di una decisione.
Inoltre osservo che il lavoro di Frank Ramsey si basa sulla normalità decisionale perché ci si attende che una persona (ovvero un decisore con una durata limitata) o una nazione (ovvero un decisore con durata illimitata) si pongano il problema di quanto e quando spendere per massimizzare l’utilità individuale o nazionale rispettivamente. Purtroppo questi calcoli e questa logica sono stati soppiantati, non solo in Italia, da decisioni politiche che sarebbe stato impossibile prevedere in quanto fuori della logica di massimizzare l’utilità. Ad esempio da più di venti anni le decisioni politiche sono state tali da minimizzare l’utilità con una massimizzazione dell’indebitamento nazionale. Quindi si tratta, evidentemente, di una politica nell’interesse di pochi contro l’interesse nazionale che porta all’impoverimento progressivo della nazione.
Propongo la mia traduzione di questo articolo di Frank Plumpton Ramsey in quanto è una esposizione chiara della soluzione di problemi complessi in modo razionale. Così avrete la possibilità di confrontarla con le incoerenze ed i danni dei politici perpetrati alla nostra nazione ed a noi individualmente.
Il testo originale è stato pubblicato in The Economic Journal Vol. 38, No. 152. (Dic. 1928) pp. 543 – 559, vol. XXXIII – Blackwell Publishing for the Royal Economic Society ed è reperibile sul sito http://www.jstor.org/stable/2224098.

Questa è la traduzione.

UNA TEORIA MATEMATICA DEL RISPARMIO

I

Il primo problema che mi propongo di affrontare è questo: una nazione quanto deve risparmiare del suo reddito? Per rispondere a questo si ottiene una semplice regola valida in condizioni di generalità sorprendente: la regola, che sarà ulteriormente chiarita nel seguito, si sviluppa come segue.

Il tasso di risparmio moltiplicato per l’utilità marginale del denaro deve essere sempre pari all’importo per cui il tasso netto totale di godimento dell’utilità rimane ad disotto del tasso massimo di godimento .

Per giustificare questa regola è, ovviamente, necessario assumere varie ipotesi semplificatrici: dobbiamo supporre che la nostra comunità proceda per sempre, senza cambiare nei numeri né nella sua capacità di godimento né nella sua avversione al lavoro; che godimenti e i sacrifici in tempi diversi possano essere calcolati in modo indipendente e sommati; e che non siano introdotte nuove invenzioni o miglioramenti nell’organizzazione eccetto quelli che possono essere considerati come condizionati esclusivamente da un accumulo di ricchezza. 1

Dovrebbe forse essere sottolineato un punto, più in particolare; si presume che non diminuiamo i godimenti successivi rispetto a quelle precedenti, una pratica che è eticamente indifendibile e deriva solo dalla debolezza della fantasia; noi includeremo, comunque, nella sezione II un tasso di sconto in alcune delle nostre indagini.

Noi ignoriamo anche del tutto considerazioni distributive, assumendo, infatti , che il modo in cui il consumo e lavoro sono distribuiti tra i membri della comunità dipende unicamente dai loro importi totali, in modo che la soddisfazione totale è funzione unicamente di questi importi complessivi.

Oltre a questo , trascuriamo le differenze tra i diversi tipi di beni e diversi tipi di lavoro, e supponiamo questi siano espressi in termini di criteri prefissati, in modo che possiamo parlare semplicemente di quantità di capitali, di consumo e di lavoro senza discutere le loro forme particolari.

1 Ovvero devono essere tali che non avverrebbero senza un certo grado di accumulo, ma potrebbe essere previsto dato il relativo grado .

Non devono essere esclusi il commercio estero, prestiti e mutui, a condizione che assumiamo che le nazioni straniere sono in uno stato stabile, in modo che le possibilità di accordarsi con esse può essere inclusa nelle condizioni di produzione costante. Noi, tuttavia, respingiamo la possibilità che uno stato di indebitamento progressivo con l’estero continui per sempre.

Infine , dobbiamo presumere che la comunità sarà sempre governata dagli stessi  stimoli per quanto riguarda l’accumulo, in modo che non vi sia alcuna possibilità che i nostri risparmi vengano egoisticamente consumati da una generazione successiva; e che non si verifichino sventure da spazzare via gli accumuli in qualsiasi momento nel futuro pertinente.

Quindi indichiamo con x(t) e a(t) i tassi totali di consumo e di lavoro della nostra comunità, e con c (t) il suo capitale al tempo t. Il suo reddito è assunto come una funzione generale delle quantità di lavoro e capitale, e sarà chiamato f ( a, c ); abbiamo poi, dal momento che il risparmio più il consumo deve essere uguale reddito,

Schermata 2014-01-06 alle 18.46.22

Ora indichiamo con U( x ) il tasso totale di utilità di un tasso di consumo x; e con V( a) il tasso totale di disutilità di un tasso di lavoro a, e chiameremo le relative aliquote marginali u (x) e v (a); così che

Schermata 2014-01-06 alle 18.46.48

Supponiamo , come al solito, che u(x) non sia mai in aumento e che v(a) non diminuisca mai.

Ora dobbiamo introdurre un concetto di grande importanza nella nostra discussione. Supponiamo di avere un dato capitale c, e non lo stiamo né aumentando né diminuendo. Allora U(x) – V(a) denota il nostro godimento netto per unità di tempo, e andremo a renderlo massimo, a condizione che la nostra spesa x sia uguale a quella che possiamo realizzare con il lavoro a e il capitale a c. Il tasso di godimento risultante U(x) – V(a) sarà una funzione di c, e crescerà, fino ad certo punto, all’aumentare di c, poiché con più capitale possiamo avere più godimento.

Questo aumento del tasso di godimento con la quantità di capitale può, tuttavia, fermarsi per uno dei due motivi. Potrebbe, in primo luogo, accadere che un ulteriore incremento di capitale non ci permetterebbe di aumentare sia il nostro reddito sia il nostro svago; o, in secondo luogo, potremmo aver raggiunto il tasso massimo concepibile di godimento, e quindi non avremmo alcuna utilità per il maggiore reddito o per il maggiore svago.

In entrambi i casi un certo capitale finito ci darebbe il maggior tasso di godimento economicamente ottenibile, sia che questo sia o non sia il massimo tasso concepibile.

D’altra parte, il tasso di godimento non può mai smettere di aumentare, all’aumentare del capitale. Vi sono poi due possibilità logiche: o il tasso di godimento aumenterà fino all’infinito, o si avvicinerà asintoticamente ad un certo limite finito. Il primo di questi casi si può escludere per il fatto che cause economiche da sole non potrebbero mai darci più di un certo tasso finito di godimento (chiamato sopra il tasso massimo concepibile). Resta il secondo caso, in cui il tasso di godimento si avvicina ad un limite finito, che può essere o può non essere uguale al tasso massimo concepibile. Questo limite si deve chiamare il tasso massimo ottenibile di godimento, anche se non può, a rigore, essere ottenuto, ma solo approssimato indefinitamente.

Quello che abbiamo in vari casi chiamato il tasso massimo ottenibile di godimento o l’utilità chiameremo per brevità Felicità o B. E in tutti i modi possiamo vedere che la comunità deve risparmiare abbastanza o per raggiungere la Felicità dopo un tempo finito, o almeno per approssimarla in un tempo indeterminato. Perché solo in questo modo è possibile raggiungere l’importo per cui il godimento ricade nell’intorno di una felicità somma nel tempo una quantità finita; in modo che se dovesse essere possibile raggiungere la felicità o avvicinarla in un tempo indeterminato, questo sarà infinitamente più desiderabile di ogni altra direzione di azione.

Ed è destinata ad essere possibile, dal momento che mettendo da parte una piccola somma ogni anno siamo in grado nel tempo di aumentare il nostro capitale di una qualsiasi misura desiderata . 1

Abbastanza deve quindi essere risparmiato per raggiungere o approssimarsi alla felicità in un qualche periodo di tempo, ma questo non significa che tutto il nostro reddito deve essere risparmiato. Più viene risparmiato più presto raggiungeremo una felicità, ma meno piacere avremmo adesso, e dovremmo mettere l’una cosa contro l’altra. Keynes mi ha mostrato che la norma che regola la quantità da risparmiare può essere determinata immediatamente da queste considerazioni. Ma prima di spiegare la sua tesi sarà meglio sviluppare quelle equazioni che possono essere utilizzate nei problemi più generali che considereremo più avanti .

1 Così com’è questo argomento è incompleto, in quanto in quest’ultimo caso sopra considerato la felicità era il valore limite, con un capitale che tende all’infinito, del godimento ottenibile spendendo tutto il nostro reddito, e quindi non effettuando alcun accantonamento per un ulteriore aumento del capitale. La lacuna può essere facilmente riempita osservando che per risparmiare £ 1 / n nell’anno n-esimo sarebbe sufficiente aumentare il capitale sociale all’infinito (dal momento che Σ 1 / n è divergente), e che la perdita di reddito (£ 1 / n ) si ridurrebbe allora a zero, in modo che i valori limite di reddito e le spese sarebbero gli stessi .

La prima di queste risulta dall’uguagliare la disutilità marginale del lavoro in qualsiasi momento al prodotto della efficienza marginale del lavoro con l’utilità marginale del consumo in quel momento,

ovveroSchermata 2014-01-06 alle 18.48.00

La seconda uguaglia il vantaggio derivato da un incremento Δx di consumo al tempo t, con quello derivante dal rinviarlo per un periodo di tempo infinitesimale Δt , che aumenterà il suo valore di Schermata 2014-01-06 alle 18.48.23, dal momento che Schermata 2014-01-06 alle 18.48.41           dà il tasso di interesse guadagnato dall’attesa.

Questo dà

Schermata 2014-01-06 alle 18.48.53

o al limite

Schermata 2014-01-06 alle 18.49.04

Questa equazione indica che u(x), l’utilità marginale del consumo, scende proporzionalmente ad un tasso dato dal tasso di interesse. Di conseguenza x aumenta continuamente a meno che o fino a che o Schermata 2014-01-06 alle 18.48.41 o u (x) si annulla, nel qual caso è facile vedere che la felicità  deve

essere stata raggiunta.

Le equazioni ( 1 ) , ( 2 ) e ( 3) sono sufficienti a risolvere il problema purché conosciamo c0, il capitale dato con cui la nazione inizia a t = 0, l’altra “condizione iniziale” essendo fornita dalle considerazioni riguardanti il comportamento della funzione per t → ∞ .

Per risolvere le equazioni procediamo come segue:  notando che x , a e c sono tutte funzioni di una variabile indipendente, cioè il tempo,

abbiamo

Traduzione Schermata 2014-01-06 alle 18.49.25

Di conseguenza , integrando per parti

Traduzione Schermata 2014-01-06 alle 18.51.48

o

Schermata 2014-01-06 alle 18.52.59

Ora dobbiamo individuare K con quello che abbiamo chiamato B, o felicità.

Ciò è più facilmente fatto iniziando in un modo diverso.

Schermata 2014-01-06 alle 18.53.16

rappresenta l’importo per cui il godimento è di poco inferiore alla felicità integrato nel tempo; questo è (o può essere reso) finito, e il nostro problema è quello di minimizzarlo.

Se applichiamo il calcolo delle variazioni da subito, usando l’equazione ( 1 ), otteniamo di nuovo le equazioni ( 2 ) e ( 3); ma se, invece di questo, prima cambiamo la variabile indipendente con c, otteniamo una grande semplificazione. Il nostro integrale diventa

Traduzione Schermata 2014-01-06 alle 18.53.31

Ora, in questa x ed a sono funzioni completamente arbitrarie di c, e per minimizzare l’integrale dobbiamo semplicemente minimizzare l’integrando uguagliando a zero le sue derivate parziali. Prendendo la derivata rispetto a x si ottiene:

Traduzione Schermata 2014-01-06 alle 18.55.37

o , come abbiamo detto all’inizio,

il tasso di risparmio moltiplicato per dell’utilità marginale del consumo deve essere sempre uguale alla felicità meno il tasso effettivo di utilità goduta.

Keynes, al quale sono grato per molti altri suggerimenti, mi ha mostrato che questo risultato può anche essere ottenuto mediante il seguente semplice ragionamento.

Supponiamo che in un anno dovessimo spendere £ x e risparmiare £ z .

Allora il vantaggio di acquistare da un extra di £ 1 spesa è u (x), l’utilità marginale del denaro, e questo deve essere uguale al sacrificio imposto risparmiando £ 1 in meno.

1 Il limite superiore non sarà ∞ , ma il minimo capitale con cui può essere ottenuta la felicità, se questo è finito. c aumenta costantemente con t, ad un certo tasso fino a che l’integrando svanisce , così che la trasformazione è ammissibile.

Risparmiare 1 £ in meno nell’anno significherà che risparmieremo solo £ z in 1 + 1 / z anni, non, come prima, in un anno. Di conseguenza, saremo in tempo 1 +1 / z anni esattamente dove avremmo dovuto essere nel tempo di un anno, e tutto l’andamento del nostro approccio alla felicità sarà posticipato di 1 / z anni, in modo che godremo 1 / z di un anno in meno di felicità e 1 / z anni di più al nostro attuale tasso.

Il sacrificio è, dunque,

Schermata 2014-01-06 alle 18.57.49

 

Uguagliandolo ad u ( x ), otteniamo di nuovo l’equazione ( 5 ), se sostituiamo z  con   Schermata 2014-01-06 alle 18.58.07     , il suo valore limite.

Purtroppo questo semplice ragionamento non può essere applicato quando prendiamo in considerazione l’attualizzazione, e pertanto ho mantenuto le mie equazioni ( 1) – ( 4) , che possono essere facilmente estese per affrontare i problemi più complessi.

La caratteristica più notevole della regola è che è del tutto indipendente dalla funzione di produzione f(a , c), tranne che nella misura in cui ciò determina la felicità, il tasso massimo di utilità ottenibile.

In particolare l’importo che dovremmo risparmiare di un determinato reddito è del tutto indipendente dall’attuale tasso di interesse, a meno che questo sia in realtà pari a zero. Il carattere paradossale di questo risultato risulterà in una certa misura mitigato più avanti, quando troviamo che se il futuro è scontato ad un tasso ρ costante e il tasso di interesse è costante e pari a r, la quota di reddito da risparmiare è una funzione del rapporto ρ / r . Se ρ = 0 tale rapporto è 0 ( a meno che anche r sia 0) e la percentuale da risparmiare è quindi indipendente da r.

Il tasso di risparmio che la regola impone è notevolmente superiore a quello che chiunque normalmente suggerirebbe, come si può vedere dalla tabella seguente, che viene presentata solo come un esempio.

Traduzione Schermata 2014-01-06 alle 18.58.28

Se trascuriamo le variazioni nella quantità di lavoro, l’importo che deve essere risparmiato su un reddito familiare di £ 500 sarebbe di circa £ 300. Perché allora la felicità meno tasso effettivo di utilità = 8-3 = 5 . Risparmio = £ 300 e l’utilità marginale del consumo di £ 200 = circa 1 / 60 £ . ( Da £ 150 a £ 300 U (x) = 13x/300 -3 – x2 / 15000, che corrisponde approssimativamente ad una parabola, così che u (x) = 13/300 – x/7500 = 1/60 se x = 200.)

Vale la pena soffermarsi un attimo a considerare quanto le nostre conclusioni sono influenzate dalle considerazioni che le nostre ipotesi semplificatrici ci hanno costretto a trascurare. Il probabile aumento della popolazione costituisce una ragione per risparmiare ancora di più, e così anche la possibilità che le invenzioni future metteranno il livello di felicità più in alto di quello che appare adatto al presente. D’altra parte, la probabilità che le invenzioni e i miglioramenti nell’organizzazione futuri sono atti a rendere gli introiti ottenibili con minor sacrificio di quello attuale è una ragione per risparmiare di meno. L’influenza delle invenzioni così opera in due modi opposti: ci fornisce nuovi bisogni che possiamo soddisfare meglio se abbiamo risparmiato in precedenza, ma anche aumenta la nostra capacità produttiva e rende il risparmio precedente meno pressante.

Il fattore più grave trascurato è la possibilità di future guerre e terremoti che distruggono le nostre accumulazioni. Questi non possono essere adeguatamente calcolati perché col determinare un tasso di interesse molto basso per lunghi periodi, dal momento che possono rendere il tasso di interesse effettivo negativo, distruggono come fanno non solo gli interessi, ma anche il capitale.

II

Propongo ora di considerare che il compenso del capitale e del lavoro siano costanti e indipendenti, 1 in modo che

f (a , c) = pa + rc

dove p, il tasso dei salari, e r, il tasso di interesse, sono costanti .

Questa ipotesi ci permetterà

(a) Di rappresentare la nostra precedente soluzione con un semplice diagramma ;

(b) Di estenderla al caso di un individuo che vive solo un tempo finito;

(c) Di estenderla per includere il problema in cui i futuri valori di utilità e di disutilità siano attualizzati ad un tasso costante.

1 Vale la pena notare che nella maggior parte di (a) si richiede solo l’indipendenza dei rendimenti, e non la costanza, e che in nessun luogo abbiamo davvero bisogno che i salari siano costanti, ma queste ipotesi sono fatte per semplificare del tutto la formulazione. Sono meno assurdi se lo stato è uno fra quelli che avanzano lentamente, in modo che i tassi di interesse e i salari sono in gran parte indipendenti da ciò che il nostro stato particolare risparmia e guadagna .

Nella nostra nuova ipotesi il reddito della comunità si divide in due parti ben definite, pa ed rc, che sarà conveniente chiamarle rispettivamente introito da guadagno e introito da rendita .

( a) L’equazione ( 2 ), che ora leggiamo

v (a) = pu( x )

determina a come funzione della sola x, e possiamo utilmente porre

y = x – pa = consumo – redditi da lavoro

w ( y) = u ( x ) = v ( a) / p

W ( y) = ∫ w (y) dy = ∫ (u (x) dx – v (a) da) = U (x) – V (a)

W ( y) può essere chiamata utilità totale e w (y) l’utilità marginale del reddito da capitale, dal momento che sono utilità totali e marginali derivanti dal possesso di una rendita y disponibile per il consumo.

L’equazione ( 5 ), ora ci dà

Traduzione Schermata 2014-01-06 alle 19.04.25

il che significa che il punto ( rc , B) si trova sulla tangente in y alla curva z = W (y) .

La figura ( 1 ) mostra la curva z = W ( y) , che raggiunge sia il valore B ad un valore y1 finito (il caso mostrato in figura) oppure vi si avvicina asintoticamente per y → ∞ .

Al fine di determinare la quantità di una data rendita rc che deve essere risparmiata, prendiamo il punto P, ( rc , B), sulla linea z = B, e da esso tiriamo una tangente alla curva (non z = B , che sarà sempre una tangente, ma l’un’altra) . Se l’ascissa di Q , il punto di contatto, è y, una quantità y della rendita verrebbe consumata, e il resto, rc – y, verrebbe risparmiata. Naturalmente y può essere negativa, il che significherebbe che non solo l’intera rendita sarà risparmiata, ma anche una parte del reddito da lavoro.

E ‘ facile vedere che ci deve essere sempre un tale tangente, perché la curva z = W (y) avrà una tangente o asintoto y = – η , dove η è il più grande eccesso di introiti rispetto al consumo compatibile con il mantenimento dell’esistenza.

Questa regola determina la quantità di un determinato reddito che dovrebbe essere spesa, ma non ci dice a quanto il nostro reddito ammonterà dopo un certo lasso di tempo . Questo è ottenuto dall’equazione ( 3 ) , che ora ci dà

Traduzione Schermata 2014-01-06 alle 19.06.03

Qui A = w (y0), dove y0 è il valore di y per t = 0 determinato come ascissa di Q , dove P è (rc0,B) .

Supponiamo, allora, che vogliamo trovare il tempo impiegato ad accumulare un capitale c da un capitale iniziale c0 , assumiamo che  P sia il punto ( rc , B ) e P0 sia ( rc0 , B ). w (y) è poi la pendenza della tangente da P, e w(y ) la pendenza della tangente da P0, in modo che nel momento in questione

Traduzione Schermata 2014-01-06 alle 19.07.18

 

Traduzione 2014-01-06 alle 19.11.04

( b) Supponiamo ora che ci occupiamo di un individuo che vive solo per un tempo determinato, diciamo T anni, invece di una comunità che vive per sempre. Abbiamo ancora l’equazione (4)

Traduzione Schermata 2014-01-06 alle 19.16.05

ma K non è più uguale a B , e deve ancora essere determinata.

Per trovarla dobbiamo sapere quanto capitale il nostro uomo sente necessario lasciare ai suoi eredi; chiamiamo questo c3.

L’equazione ( 8 ) indica, come prima che y può essere trovato come l’ascissa del punto di contatto Q di una tangente tirata da ( rc , K ) ovvero P alla curva. P si trova sempre su z = K , e la sua ascissa comincia da rc0 e finisce in rc3. K si può assumere come minore di B, poiché un uomo che vive solo un tempo finito risparmierà meno di chi vive un tempo infinito, e maggiore sarà K , maggiore sarà il tasso di risparmio. Di conseguenza, z = K incontrerà la curva , diciamo in P4.

Schermata 2014-01-06 alle 20.32.34

Da entrambi P0 e P3 ci saranno due tangenti alla curva, di cui o la superiore o quella inferiore può, per quanto ne sappiamo, essere presa come determinante y0 e y3 Se, tuttavia, c3 > c0 come in fig . 2, possiamo solo prendere la tangente inferiore da P0, perché la tangente superiore dà un valore di y0 maggiore di uno dei valori di y3 , che è impossibile, in quanto y aumenta in modo continuo. Prendendo, poi , Q0 come il punto di contatto della tangente inferiore da P0, ci sono due possibili casi, secondo se prendiamo  y3 come determinante o di Q3, il minore, o Q3‘, il valore superiore. Se prendiamo Q3, P0 porta direttamente a P3, e qui ci sarà sempre risparmio; questo accade quando T è piccolo. Ma se T è grande, Q0 porta direttamente a Q3‘, e P0 va in primo luogo a P4, e poi indietro a P3, all’inizio qui c’è il risparmio, e successivamente sperpero.

Allo stesso modo , se c0 > c3 , ci sono due possibili casi, e in questo caso è la tangente inferiore da P3 che non può essere presa .

Al fine di determinare quali tangenti prendere e anche il valore di K dobbiamo utilizzare la condizione derivata dall’equazione (7)

Traduzione Schermata 2014-01-06 alle 20.33.06

Questo , unitamente al fatto che le ascisse di P0 e P3 sono c0, c3, e che hanno la stessa ordinata K , è sufficiente a fissare sia K e le tangenti da adottare.

(c) Dobbiamo ora vedere come i nostri risultati devono essere modificati quando non riteniamo le future utilità e disutilità uguali a quelle attuali, ma le attualizziamo ad un tasso costante ρ.

Questo tasso di attualizzazione di vantaggi futuri deve, naturalmente, essere distinto dal tasso di attualizzazione di future somme di denaro.

Se posso prendere in prestito o dare  in prestito ad un tasso r devo necessariamente essere altrettanto soddisfatto con un extra di £ 1 ora e un extra  £ (1 + r) dopo un anno, dal momento che potrei scambiare l’ uno con l’altro. Il mio tasso marginale di sconto per il denaro è, dunque, necessariamente r, ma il mio tasso di sconto per l’utilità può essere molto diverso, dal momento che l’utilità marginale del denaro per me può variare per il mio aumentare o diminuire della spesa col passare del tempo .

Assumendo il tasso di sconto costante, non voglio dire che è lo stesso per tutti gli individui dal momento che attualmente ci occupiamo di un solo individuo o di una comunità, ma che il valore attuale di un godimento ad una qualche data futura deve essere ottenuto attualizzandolo al tasso ρ. Così, assumendo che sia circa 3/4 per cento, l’utilità in certo momento sarebbe considerata come due volte più desiderabile di quella di cento anni più tardi, quattro volte più preziosa che 200 anni più tardi, e così via ad un tasso di attualizzazione composto.

Questa è l’unica ipotesi che possiamo fare, senza contraddire la nostra ipotesi fondamentale che le generazioni successive sono mosse dallo stesso sistema di preferenze. Infatti, se avessimo avuto un tasso variabile di attualizzazione – vale a dire dire uno più alto per i primi 50 anni – la nostra preferenza per godimenti nel 2000 d.C. rispetto a quelli del 2050 d.C. verrebbero calcolati al tasso più basso, ma quello delle persone vive nel 2000 d.C. sarebbe al valore più alto.

Supponiamo in primo luogo che il tasso di sconto per l’utilità ρ sia inferiore al tasso di interesse r.

Allora le equazioni (1) e (2) sono invariate, ma l’equazione (3) diventa

Schermata 2014-01-06 alle 20.36.05

se stiamo assumendo   Schermata 2014-01-06 alle 20.36.18       costante e uguale a r;

Traduzione Schermata 2014-01-06 alle 20.36.55

Questa equazione è la stessa della (8) tranne che invece di w(y) e W(y), che è ∫ w(y) dy, abbiamo wr / (r – ρ )(y) e  ∫ w r / (r – ρ )(y) dy.

Il metodo di soluzione sia per una comunità sia per un individuo è dunque lo stesso di prima, tranne che al posto dell’effettiva utilità della rendita da capitale dobbiamo considerare che possiamo affermare la sua utilità modificata, ottenuta integrando l’utilità marginale alla potenza r/(r-ρ). Questo ha l’ effetto di accelerare la diminuzione dell’utilità marginale e di diminuire l’importanza relativa di alti redditi. In questo modo possiamo tradurre la nostra attualizzazione del futuro in una attualizzazione di alti redditi. La velocità con cui questo viene fatto è disciplinata esclusivamente dal rapporto ρ su r, in modo che se ρ è 0, esso è indipendente dal valore di r, purché questo non sia 0. La conclusione principale della sezione I viene così confermata.

Vi è, tuttavia , una piccola difficoltà, perché non abbiamo ancora veramente dimostrato che se consideriamo un tempo infinito, la costante K deve essere interpretata come quella che si potrebbe chiamare “felicità modificata”, vale a dire il valore massimo di Schermata 2014-01-06 alle 20.42.01

Questa felicità modificata richiederebbe lo stesso reddito come per la felicità, essendo la modifica esclusivamente nel valore impostato su di essa. Questo risultato può tuttavia essere dedotto immediatamente dall’equazione ( 9a ), che dimostra che y aumenta fino a che si

raggiunge la felicità, così che  Schermata 2014-01-06 alle 18.58.07        non possa mai diventare negativa e K non può essere inferiore alla felicità modificata. D’altra parte, purché questa condizione sia soddisfatta, la 9 (a) mostra che più grande è la y inizialmente, più piccola sarà la A,  più grande sarà y nel tempo futuro. Quindi K deve essere la più piccola possibile (purché non sia così piccola da rendere Schermata 2014-01-06 alle 18.58.07             in fine negativa) ; in modo che K non può essere maggiore della felicità modificata. Quindi se non è né inferiore né maggiore  deve essere uguale.

Come in (b), si può adattare la nostra soluzione al caso di un individuo con solo un tempo finito di vita, così in questo caso disegnerò le tangenti alla curva di utilità modificata.

Un caso particolare interessante è quella di una comunità per la quale

Traduzione Schermata 2014-01-06 alle 20.42.50

E’ chiaro che corrisponde a K = B nel caso in cui ρ = 0

abbiamo qui K = K1

e il risparmio  Schermata 2014-01-06 alle 20.44.46ovvero, una percentuale costante Schermata 2014-01-06 alle 20.44.57     della rendita da capitale deve essere risparmiata, che se ρ = 0 sarà   Schermata 2014-01-06 alle 20.45.13                   e indipendente da r.

Se il tasso di interesse è inferiore al tasso di attualizzazione dell’utilità, avremo equazioni simili, che portano ad un risultato molto diverso. L’utilità marginale del consumo aumenterà ad un tasso ρ –  r, e il consumo scenderà verso il livello più basso di sussistenza per il quale la sua utilità marginale può essere presa come infinita, se trascuriamo la possibilità del suicidio. Durante questo processo tutto il capitale verrà consumato e i debiti contratti si estenderanno a quelli da cui sono stati ottenuti, l’ipotesi più semplice a questo punto è che sarà possibile prendere in prestito una somma tale che è solo possibile per restare in vita dopo aver pagato gli interessi su di essa.

III

Consideriamo ora il problema della determinazione del tasso di interesse .

(α) In primo luogo, supponiamo che tutti attualizzano l’utilità futura per sé o per i propri eredi, allo stesso tasso ρ.

Allora in uno stato di equilibrio non ci sarà alcun risparmio e

Traduzione Schermata 2014-01-06 alle 20.45.38

tre equazioni per determinare x , a e c .

L’ ultima equazione ci dice che il tasso di interesse come determinato dalla produttività marginale del capitale   Schermata 2014-01-06 alle 20.36.18            , deve essere uguale al tasso di attualizzazione ρ.1

Ma supponiamo che in un dato momento, diciamo quello presente,  Schermata 2014-01-06 alle 20.36.18         > ρ.

Allora non ci sarà equilibrio, ma il risparmio, e poiché una grande quantità non può essere risparmiata in un breve periodo di tempo, potrebbe volerci secoli prima che l’equilibrio sia raggiunto, o può non essere mai raggiunto, ma solo approssimato asintoticamente; e si pone la questione di come, nel frattempo, il tasso di interesse viene determinato, poiché non può esserlo dall’equazione ordinaria di equilibrio della domanda e dell’offerta .

La difficoltà è che il tasso di interesse non funziona come richiesta di prezzo per un intera quantità di capitale, ma come un prezzo di fornitura, non per una quantità di capitale, ma per un tasso di risparmio. Lo stato risultante della situazione è rappresentata in fig. 3, in cui, tuttavia, variazioni della quantità di lavoro sono trascurate. Questo mostra la curva di domanda per il capitale r =Schermata 2014-01-06 alle 20.36.18    , la curva definitiva di offerta r = ρ e la curva temporanea di offerta c = c0 .

È chiaro che il tasso di interesse è determinato direttamente dalla intersezione della curva di domanda con le temporanea curva di offerta c = c0. La curva definitiva di offerta r = ρ entra in gioco solo in quanto disciplina il tasso al quale c0 approssima il suo valore definitivo OM , un tasso che dipende approssimativamente dal rapporto di PM su QN. Vediamo, dunque , che il tasso di interesse è disciplinato principalmente dal prezzo di domanda, e può superare di gran lunga la ricompensa definitiva necessaria per indurre l’astinenza.

1 L’ equilibrio potrebbe, tuttavia, essere ottenuto o alla felicità  con ρ < Schermata 2014-01-06 alle 20.36.18      , o al livello di sussistenza con  ρ >  Schermata 2014-01-06 alle 20.36.18  . Cfr. ( γ ) di seguito .

Allo stesso modo, nella contabilità di uno Stato Socialista la funzione del tasso di interesse garantirebbe l’uso più saggio del capitale esistente, non servirebbe in alcun modo diretto come guida per la quota di reddito che deve essere risparmiata.

(β) Ora dobbiamo cercare di tenere un po’ in conto il fatto che persone diverse attualizzano l’utilità futura a tassi differenti, e, a parte il fattore tempo, non sono abbastanza interessati ai loro eredi come in loro stessi.

Supponiamo che non siano interessati affatto ai loro eredi;

Schermata 2014-01-06 alle 20.48.25

che ad ogni uomo è imposta una quota del mantenimento di quei bambini che sono necessari per mantenere in esistenza la popolazione, ma inizia la sua vita lavorativa, senza alcun capitale e si conclude senza alcuno, dopo aver speso i suoi risparmi in una annualità; che all’interno della sua propria vita ha un programma di utilità costante per il consumo e l’attualizzazione di utile futuro ad un tasso costante, ma che questo tasso si può supporre diverso per persone diverse.

Quando tale comunità è in equilibrio , il tasso di interesse deve, ovviamente0, essere uguale al prezzo di offerta di capitale  Schermata 2014-01-06 alle 20.36.18       . E sarà anche uguale al ” prezzo di fornitura “che nasce nel seguente modo.

Supponiamo che il tasso di interesse sia costante e pari a r, e che il tasso di attualizzazione di un determinato individuo sia ρ. Allora, se r > ρ, egli risparmierà quando è giovane, non solo per provvedere per la perdita della capacità di guadagno in età avanzata, ma anche perché può ottenere più sterline da spendere in un secondo momento rispetto a quelle che rinuncia a spendere ora. Se trascuriamo le variazioni nella sua capacità di guadagno, la sua azione può essere calcolata modificando le equazioni IIc applicandole ad una vita definita come in IIb. Egli accumulerà per un periodo il capitale, e quindi lo spenderà prima di morire. A parte quest’uomo, dobbiamo supporre che ci siano nelle nostre comunità altri uomini, esattamente come lui, tranne che per essere nati in tempi diversi. Il capitale totale posseduto da n uomini di questo tipo le cui date di nascita sono distribuite uniformemente per tutto il periodo di una vita sarà n volte il capitale medio posseduto da ciascuno nel corso della sua vita. La classe degli uomini di questo tipo possederà, dunque, un capitale costante a seconda del tasso di interesse, e questo sarà l’importo del capitale da essi fornito a quel prezzo. (Se ρ > r, potrebbe essere negativo, in quanto potrebberoro prendere in prestito da giovani e rimborsare da vecchi.) Possiamo quindi ottenere la curva di offerta totale del capitale sommando le forniture ad un determinato prezzo per ciascuna classe dei singoli individui.

Se, poi, si trascura l’interesse degli uomini nei loro eredi, vediamo che il capitale ha un prezzo di cessione determinato per essere equiparato al suo prezzo di domanda. Questo prezzo di offerta dipende da tassi di attualizzazione delle persone per l’utilità, e può essere equiparato al tasso di attualizzazione del “risparmiatore marginale”, con il significato di qualcuno il cui tasso di attualizzazione è pari al tasso di interesse che né risparmia né prende a prestito (salvo per provvedere  alla vecchiaia ) .

Ma la situazione è diversa dal problema di fornitura ordinaria, in questo che quelli oltre questo “margine ” non forniscono semplicemente nulla, ma determinano una prestazione negativa prendendo in prestito quando sono giovani contro i loro guadagni futuri, ed essendo mediamente in debito.

(γ) Ora torniamo al caso (α) immaginando uomini, o piuttosto famiglie, che vivono per sempre, e il tasso di attualizzazione dell’utilità futura costante, ma cerchiamo questa volta di tener conto delle variazioni del tasso di attualizzazione da famiglia a famiglia.

Per semplicità supponiamo che la quantità di lavoro è costante, in modo che il reddito totale del paese può essere considerato come una funzione f(c), del solo capitale. Il tasso di interesse sarà allora f”(c). Supponiamo anche che ogni individuo possa raggiungere la massima utilità concepibile con un reddito x1 finito, e che nessuno potrebbe sostenersi in vita con meno di x2.

Ora supponiamo che l’equilibriosi ottenga con un capitale c, reddito f(c), e un tasso di interesse f'(c) o r. Allora queste famiglie, diciamo in numero di m(r), il cui tasso di attualizzazione è inferiore a r devono aver raggiunto la felicità o starebbero ancora aumentando la loro spesa secondo l’equazione (9a). Di conseguenza, esse avranno tra loro un reddito m (r).x1. Le altre famiglie, in numero n – m (r) (dove n è il numero totale delle famiglie), devono essere al livello di sussistenza, o starebbero ancora diminuendo le loro spese. Di conseguenza queste avrebbero tra loro  un reddito complessivo { n – m(r)} x2,

Traduzione Schermata 2014-01-06 alle 20.49.46

che, insieme con r = f ‘( c ), determina r e c.  Essendo m (r) una funzione crescente di r, è facile vedere, disegnando i grafici di r in funzione di f ( c ), che le due equazioni hanno in generale una unica soluzione unica 2.

In tal caso, quindi, l’equilibrio sarebbe raggiunto da una divisione della società in due classi, la classe parsimoniosa che gode della felicità e una improvvida al livello di sussistenza.

F.P. Ramsey

King’s College , Cambridge.

1 Si è supposta ogni famiglia in equilibrio, che è l’unico modo in cui questo stato può essere mantenuto,dal momento che altrimenti, sebbene i risparmi di alcuni bilancerebbero in ogni istante i prestiti degli altri, non continuerebbero a farlo se non per un fatto straordinario.

2 Abbiamo trascurato in questo il numero trascurabile di famiglie per cui ρ è esattamente uguale a r.

Annunci

THE DOUGLAS PROPOSALS

26 Set

Ramsey_2Riporto la mia traduzione di un interessante articolo di economia di Frank Ramsey il cui testo originale si trova negli Archivi del Dipartimento di Filosofia Scientifica Collezione Speciale dell’Università di Pittsburg (al Box n.7, folder 3 parte 1)

Si tratta della contestazione di una teoria economica, con purtroppo ancora dei seguaci, che si basa su un errore di logica non facilmente determinabile se non attraverso un corretto ragionamento partendo da casi semplici e con un sistema di analisi più complesso per contenere tutti i casi possibili.

Clifford Hugh Douglas (1879 -1952) sosteneva (L’illusione della Super – Produzione dell’anno 1918, Democrazia economica – Il credito e la democrazia dell’anno 1920)  che la somma di stipendi, salari e dividendi sono inferiori ai prezzi dei beni e servizi prodotti settimanalmente e pertanto i lavoratori non possono avere denaro sufficiente ad acquistare i beni ed i servizi prodotti. Ne conclude che il sistema della contabilità rende tecnicamente impossibile la consegna di merci e servizi e quindi il sistema è costruito per massimizzare i profitti di chi ha il potere economico (questo forse è vero, ma per altri e più banali motivi) e realizzare un’inutile scarsità. Il ragionamento appare, a prima vista plausibile, ma è errato nella maggior parte dei casi come dimostra Ramsey.

Questo saggio rivela il brillante ingegno matematico di Frank Ramsey e la sua capacità di operare in ambiti logici diversissimi. Secondo quanto riportato da Keynes gli economisti si recavano da lui per avere conferma o contestazione delle loro elaborazioni oppure per tradurre in formule le loro valutazioni.

Credo che questo genio ci manchi molto nella situazione attuale.

Vorrei notare come nelle sue dimostrazioni sia molto chiaro l’ambito di applicabilità ed i limiti delle teorie che espone. Purtroppo è una qualità che manca a molti attuali economisti che operano, spesso con effetti catastrofici, con teorie molto matematiche e poco coerenti con le condizioni al contorno o quelle della realtà. Per non parlare di chi usa formule matematiche di terzi senza sapere dove si possono applicare e le applica a sproposito in situazioni che nulla hanno a vedere con l’analisi che si vuole fare.

Quindi c’è da sperare che anche le formule esposte in questo articolo non vengano prese ed usate a sproposito.

Questa è la traduzione.

I CONCETTI PROPOSTI DA  DOUGLAS

A chi è interessato ai concetti proposti da Douglas raccomanderei di studiare Dividendi per tutti, di W. Allen Young, un libretto da sei penny in possesso di evidenti vantaggi sia in termini di brevità e chiarezza rispetto all’esposizione del Maggiore Douglas stesso che è sempre oscuro e spesso assurdo. Le affermazioni più importanti si possono trovare nelle pag. 13 e 20.

(1) ” Si sostiene che i salari, gli stipendi e i dividendi emessi in qualsiasi periodo unitario di tempo non sono mai sufficienti ad acquistare i prodotti finali immessi per la vendita durante lo stesso periodo. ”

(2) “Un nuovo fondamento per i prezzi. – I beni di uso finale (ad esempio il carbone per uso domestico) saranno venduti a meno del loro costo, alla stessa frazione del costo (che è quello che include tutti i dividendi e utili) come il Consumo Totale di tutte le Merci sostiene  la Totale Produzione di Credito Effettivo durante uno specifico periodo di tempo. Con questo metodo, i prezzi attuali sarebbero ridotti a circa un quarto del costo totale ……..

“il Governo rimborserà ai proprietari (ad esempio, i proprietari di miniera di carbone) la differenza tra il costo complessivo sostenuto, e il loro prezzo totale ricevuto, per mezzo di buoni del Tesoro, tali buoni verrebbero addebitati come avviene adesso sul conto del Debito Nazionale.”

A favore di (1) Young afferma: “ll prezzo è quindi costituito da due grandi somme erogate dal Produttore: (A) Tutte le somme versate per le materie prime e spese generali, e (B) tutti gli importi versati in salari, stipendi e dividendi. Quindi il prezzo è uguale a (A) più (B). Ma il denaro pagato come(B) è tutto il denaro che al consumatore di questo paese è dato per comprare le merci che lui stesso aiuta a produrre con la propria attività manuale, con il cervello o con il capitale ….. Pertanto, (B), la quantità di denaro totale emessa, non sarà mai sufficiente a comprare tutte le merci il cui prezzo è (A) più (B). ”

Quindi afferma “È stato sostenuto dagli oppositori a questo schema che di nove fabbriche che forniscono prodotti finali per il consumo questo può essere vero; ma che nello stesso periodo di tempo una decima fabbrica produrrà merci intermedie che non rientrano nel mercato al consumo, ma in relazione alle quali vengono emessi i salari, gli stipendi e dividendi  che possono assorbire l’eccedenza dagli altri nove.” Oltre alla precisione o meno del rapporto di nove a uno, questo argomento è molto semplice e sembra mostrare una vera e propria falla nel ragionamento di Douglas, in modo che è fondamentale esaminare attentamente ciò che Young dice in risposta ad esso. La sua risposta è triplice : –

“(a) La moneta emessa dalla decima fabbrica non poggia su una relazione matematica definita rispetto al valore del prezzo dei beni di consumo finali immessi sul mercato dalle altre nove fabbriche, e non sarebbe sufficiente a bilanciarli se i relativi prezzi rimangono stabili.”

Ma mentre questo non gli sta bene esiste una relazione matematica precisa, dal momento che egli stima che il deficit totale di potere d’acquisto pari a 1 : 4. E in ogni caso l’affermazione che il denaro può o non può essere sufficiente non può essere considerata come una prova che non sia sufficiente.

” (b) Ma i loro prezzi non rimangono costanti. I grossisti e i dettaglianti, quando il denaro della decima fabbrica entra nel mercato, trovano che la domanda è salita senza che la produzione sia cresciuta. Essi quindi aumentano i prezzi. In altre parole, l’effetto del denaro introdotto dalla decima fabbrica non è di eliminare l’eccedenza di tutte le merci in eccedenza delle altre nove, ma solo di eliminare qualcuna di queste, fino a che un aumento dei prezzi bilanci la nuova moneta introdotta nel mercato. Così i prezzi crescono per chi ricava denaro dalle altre nove fabbriche, che rende ancora più impossibile per questi (che ricava denaro dalle altre nove fabbriche) di acquistare tutti i beni di prodotti finali, se lo volessero fare.”

Questo argomento fallisce lo scopo; quello che viene suggerito, in risposta alla tesi di Douglas è che nello stesso periodo di tempo altre fabbriche produrrebbero merci non per il consumo immediato e che i salari e i dividendi versati da quelle fabbriche potrebbero costituire una distribuzione di potere d’acquisto sufficiente a consentire che il surplus venga acquistato . Come è evidente, i salari dei lavoratori che producono prodotti intermedi, come il carbone per uso industriale, sono un fattore sempre presente nella domanda di beni di consumo; non ha senso parlare di un aumento dei prezzi quando questi salari entrano nel mercato.

Ma anche se non fallisse lo scopo, l’asserzione non è plausibile . Ex hipotesi è impossibile vendere, anche al costo, una gran parte dei beni di consumo prodotta. Se poi ci fosse qualche concorrenza, è poco probabile che i prezzi saliranno al di sopra dei costi in qualche misura apprezzabile.

” (c) Anche nel periodo successivo di tempo i costi totali della decima fabbrica entrano nei prezzi dei beni finali prodotti dalle altre nove “. (Certamente.) ” Così la velocità del flusso del potere di acquisto è sempre minore della velocità di flusso dei prezzi. “Questo è ciò che sta cercando di dimostrare, e chiaramente non consegue dall’osservazione precedente. Questo argomento è una mera affermazione del punto da provare.

Usiamo “prezzo di costo ” per includere il conservare il capitale, ma non il costo per aumentarlo, questo è ovviamente il corretto utilizzo, ed è, penso quello di Douglas e dei suoi seguaci. Abbiamo visto che non sono stati avanzati motivi da Douglas per pensare che il rapporto, che il prezzo di vendita deve dare rispetto al prezzo di costo se il potere d’acquisto distribuito è in grado di acquistare tutti i beni di consumo prodotti, sia inferiore all’unità. Ma questo può, tuttavia, essere il caso.

Vi è, tuttavia, un argomento forte e semplice per supporre che il rapporto non differisca sensibilmente dall’unità. Perché è facile vedere che in uno stato stazionario, cioè quello in cui la produzione va avanti a un ritmo immutabile e i prezzi, i salari e la ricchezza nazionale non cambiano mai, il rapporto sarebbe l’unità. Perché in un tale stato il tasso di flusso del costo dei beni di consumo prodotti è A + B con la notazione introdotta qui sopra, dove A , B vengono sommati per tutte le fabbriche che producono beni di consumo. Il potere d’acquisto è distribuito da queste fabbriche in ragione di B. Ma il tasso degli altri pagamenti A essendo fatto da queste fabbriche, rappresenta i pagamenti dei dividendi e dei salari fatte in un momento precedente da altre fabbriche che producono prodotti intermedi. Pertanto, nell’ipotesi di produzione immutabile , la distribuzione del potere d’acquisto da tutte queste altre fabbriche procede al tasso A. In modo che il tasso globale di distribuzione o potere d’acquisto è A + B, che equivale al tasso di flusso del prezzo di costo dei beni di consumo. Poiché il rapporto è l’unità per uno stato stazionario, è improbabile che allo stato attuale differisca notevolmente dall’unità, perché lo stato attuale non è molto lontano dall’essere stazionario.

Ma è possibile utilizzando alcune complicate operazioni matematiche dimostrare che il rapporto è l’unità sotto condizioni molto più ampie, che consentono di tenere conto di variazioni della quantità di produzione, del tasso dei salari, della produttività del lavoro, della ricchezza nazionale. La prova di questo è riportata di seguito, ma saranno in grado di seguirla solo quelli  che hanno familiarità con l’integrazione per parti.

Partiamo dal presupposto che tutto il lavoro è esprimibile in termini di unità o di lavoro . Che i risultati del lavoro sono merci, non necessariamente prodotti finiti, ma può darsi miglioramento di  merci e, in ogni caso esprimibile in termini di unità che dobbiamo chiamare, in mancanza di meglio, unità di merce. La nozione di merce comporta la nozione di utilità, in modo che le merci meno utili conterrebbero meno unità di merce. Chiameremo la produttività del lavoro in un dato momento il numero di unità di merci derivanti da una unità di lavoro ad un certo istante. La produttività per esempio si ridurrebbe se terreni meno fertili vengono messi in coltivazione, e aumenterebbe se la produzione fosse organizzata in modo più efficiente.

Sia T l’istante di tempo considerato.

Siano W(T) i salari pagati per unità di lavoro all’istante T.

Sia P (T) la produttività del lavoro all’istante T.

Quindi il numero di unità di lavoro necessari per produrre un’unità di merce è 1 / P ( T ), e il suo costo è W (T) / P (T).

Il tasso al quale vengono aggiunte unità di merce al tempo T ai beni che saranno effettivamente completi e  disponibili per il consumo al tempo t successivo sarà chiaramente funzione sia di T sia di t. Dobbiamo porre alcune ipotesi circa la forma di questa funzione, e l’unica che sembra condurre ad un’analisi funzionale è che la funzione in questione è il prodotto di una funzione di T e una funzione di t: vale a dire, che le proporzioni in cui al tempo T il lavoro viene speso per beni che saranno disponibili per il consumo a diversi intervalli di tempo è indipendente da T. (Questa ipotesi potrebbe essere incompatibile con le  fluttuazioni industriali e quindi implicare una semplificazione o valutazioni sulla media dei processi). Indichiamo questo prodotto con F (T) f (t). Quindi i salari pagati in ragione di unità di merce aggiunta al tempo T ai beni che saranno effettivamente pronti per il consumo al successivo tempo t  saranno F (T) f (t) W (T) / P (T) , e noi proponiamo di abbreviare e scrivere B (T) f (t).

Assumiamo un tasso costante continuo di interesse r, in modo che se z è la quantità di capitale C dopo il tempo t abbiamo dz / dt = rz, che fornisce z = Cert; e questo è anche il costo sostenuto in qualsiasi momento dopo aver speso C al tempo t in precedenza.

Per motivi pratici, è lecito ritenere che il periodo massimo tra l’inizio del lavoro su un bene e il suo completamento non superi una certa quantità finita t0.

Possiamo ora definire il capitale nazionale in possesso di chi controlla l’industria in qualsiasi momento pari alle merci incomplete accumulate al prezzo di costo (comprensivo di interessi), e supponiamo che un equivalente esatto in titoli ed azioni sia stato distribuito al pubblico a cui i controllori pagano interessi al tasso r, e che la variazione di questo capitale sia sempre accompagnata da un pari ammontare di nuovi prestiti da parte del pubblico o dal rimborso di tali prestiti.

La velocità di flusso dei prezzi di costo dei beni che diventano disponibili per il consumo al tempo T è

Schermata 2014-01-04 alle 21.04.05

perché il prodotto B (T – t ) f ( t ) rappresenta i salari pagati al tempo T – t in conto dei beni che diventano disponibili al successivo tempo t, cioè al tempo T, e il fattore di ert è inserito al fine di ottenere il costo effettivo sostenuto quando l’interesse viene preso in considerazione . Allo stesso modo la velocità con cui i salari vengono pagati al tempo T è

Schermata 2014-01-04 alle 21.16.04

Anche il capitale nazionale al tempo T come definito sopra è

Schermata 2014-01-04 alle 21.16.49

Perché B (T-u) f ( t) dt rappresenta i salari pagati al momento T-u in conto dei beni che si renderanno disponibili fra il tempo t e il successivo t + dt; e stiamo considerando solo i beni che sono incomplete al tempo T, vale a dire, al tempo u successivo a T-u , dobbiamo integrare dal valore minimo di t ovvero u , al valore massimo t0 , così che

Schermata 2014-01-05 alle 15.35.14

rappresenta i salari pagati al momento T-u per tutti i beni che risulteranno incompleti al tempo T; il fattore e si inserisce come prima, al fine di tener conto degli interessi.

I dividendi essendo versati al pubblico in qualche istante di tempo ammonteranno a r volte il capitale nazionale.

Il tasso al quale vengono costituiti nuovi prestiti da parte del pubblico è il coefficiente differenziale con riferimento al momento del capitale nazionale, vale a dire dC (T) / dt .

Supponiamo ora che x (T) sia il rapporto che abbiamo cercato di trovare, cioè il rapporto che i prezzi di vendita dei beni di consumo dovrebbero avere sui prezzi di costo al tempo T in modo che non ci sarebbe né un accumulo di beni di consumo invendibili né di potere d’acquisto invendibile nelle mani del pubblico. Quindi uguagliamo il tasso totale a cui il pubblico riceve il potere d’acquisto in forma di salari e dividendi con i prezzi d’acquisto delle merci risultanti disponibili per il consumo ed il tasso a cui il pubblico costituisce nuovi investimenti, quindi abbiamo

Schermata 2014-01-05 alle 15.59.18

Mostreremo ora che questa equazione può essere soddisfatta solo se x (T) = 1 .

Perché, integrando per parti il coefficiente di x ( T ) e assumendo che B ( T ) sia continua e derivabile, abbiamo

Schermata 2014-01-05 alle 15.59.37

e un confronto di questa equazione con l’ultima mostra che x (T ) = 1 .

Abbiamo ottenuto questo risultato imponendo determinate condizioni, ed è interessante vedere come il risultato è influenzato dalle variazioni di condizioni. La prima condizione che, nel calcolo dei costi, l’interesse è preso ad un tasso fisso r, non possiamo farne a meno; ma in condizioni modificate potremmo ammettere un tasso variabile di interesse sugli investimenti calcolando i dividendi al tasso r su un capitale nominale. L’altra condizione stabilita era l’uguaglianza del capitale nominale con il capitale nazionale come definito, e che le variazioni di questo siano  sempre accompagnate da nuovi investimenti o dal rimborso di investimenti . Passiamo fare a meno di queste condizioni e chiamare Q (T) il capitale nominale al tempo T e supponiamo che L (T), che definiamo come il tasso (positivo o negativo) a cui il pubblico investe il denaro, non sia necessariamente uguale a dQ (T) / dt . Quindi l’equazione per x ( T ) diventa

Schermata 2014-01-05 alle 16.22.50

Abbiamo visto che se sostituiamo C (T) con Q (T) e dC (T) / dT con L (T) allora x (T) = 1 . Ne segue che x (T) è maggiore o inferiore all’unità , a seconda se

rQ (T) – L T) > oppure < rC (T) – dC (T) / dt ,

o se

r { Q (T) – C (T) } > oppure < L (T) – dC (T) dT .

Possiamo riassumere i principali casi in cui x (T) < 1 , come segue : –

(1) Supponiamo che L (T)= dQ (T) / dt , cioè , l’aumento del capitale nominale sia accompagnato da nuovi uguali investimenti; allora x (T) < 1 se dZ (T) / dt > rZ (T) , dove Z ( T) è uguale a (Q(T) – C(T) ), e può essere chiamata la capitale fittizio .

Quindi;

(a) Z ( T ) > 0, ( cioè , lo stato è sovracapitalizzato) – in questo caso il tasso di aumento di capitale fittizio deve superare il tasso di interesse; una situazione che non può essere mantenuta a lungo, così questo caso non è importante

Oppure ( b) Z (T) < 0 , cioè , le stato è sottocapitalizzato – in questo caso x (T) < 1, a meno che il tasso percentuale di aumento della sottocapitalizzazione superiore al tasso di interesse (ad esempio, uno stato socialista non paga alcun interesse, ma calcolandolo come un elemento di costo venderebbe chiaramente sotto costo).

(2) Supponendo che Q (T) = C (T), cioè, non vi è capitale fittizio, allora x (T) < 1 se L (T) > dC(T) / dT cioè , > dQ (T) / dT . Questo potrebbe solo normalmente accadere se nuovi investimenti portassero interessi ad un tasso s (poniamo ) < r, tasso a cui l’interesse è stimato in termini di costo. In questo caso l’ipotesi Q (T) = C (T) significa che il tasso di nuovi investimenti da’ al tasso di incremento del capitale nazionale il rapporto r : s.

Così che le uniche circostanze importanti alle quali dobbiamo vendere sotto costo, vale a dire 1(b), quando i dividendi vengono pagati meno del capitale nazionale; e la (2) quando il tasso di interesse sui nuovi investimenti è inferiore a quello in cui l’interesse è calcolato come un elemento di costo, sono come sarebbe ovvio per il senso comune ed è chiaramente irrilevante la tesi del Maggiore Douglas che “giusto prezzo” è oggi un quarto del prezzo di costo.

F.P. Ramsey

ON THE NATURE OF ACQUAINTANCE. – PRELIMINARY DESCRIPTION OF EXPERIENCE.

24 Set

Greuze La brocca rottaRiporto di seguito la mia traduzione di un articolo di Bertrand Russell pubblicato su MInd nel 1914 riguardante alcuni concetti basilari della teoria della conoscenza. Il testo originale è stato tratto dal sito dall’Hegler Institute  al link http://www.jstor.org/stable/27900472 .

L’interesse per questo testo, per altro incompleto di quelle parti seriamente contestate nei colloqui privati da Ludwig Wittgenstein, è essenzialmente legato alle elaborazioni della teoria della conoscenza dello stesso Wittgenstein e di Frank Plumpton Ramsey. Pertanto dobbiamo dire che queste elaborazioni sono state la base di uno sviluppo vigoroso della filosofia della conoscenza con importanti riflessi sulla scienza come, ad esempio, tutta la teoria della probabilità per le valutazioni in condizioni di incertezza; per non parlare dei riflessi sulla matematizzazione della scienza economica con conseguenze, tuttavia, spesso negative. Ciò non per errori degli ingegneri della conoscenza, ma piuttosto per l’uso di modelli inapplicabili a casi reali o generalizzazioni di fenomeni microscopici a quelli macroscopici. Infatti molti errori sono riconducibili all’aver usato formule di cui non si sapeva cosa significassero inserendo i parametri di un caso attuale. Questa procedura, che si applica spesso anche nell’ingegneria ordinaria, può essere accettata solo se si hanno dei riferimenti per controllare che i risultati non siano fuori di certi limiti che la logica imporrebbe. Viceversa siamo giunti all’adorazione delle formule matematiche dell’economia la cui contestazione è considerata blasfemia qualsiasi sia il risultato pratico a cui portino. Manca, cioè, la valutazione critica del risultato nell’ambito del modello di studio. E’ un errore frequente in molti campi del lavoro intellettuale. Faccio un banale esempio capitato a me in un periodo non recente.

Dovendo mettere in una casa di campagna, non abitata se non saltuariamente, in zona molto fredda in inverno un impianto capace di un riscaldamento molto veloce optai per un impianto ad acqua calda a termoconvettori. Questi apparecchi hanno un dimensionamento basato sul calcolo estivo e quindi lo scambiatore è calcolato per un salto termico molto piccolo. Nel sistema invernale il salto termico è molto alto e può superare, a regime, anche  di molto i 10 gradi. Quindi se l’impianto è squilibrato il termoconvettore meglio servito si prende tutto il calore e lascia gli altri freddi. Pertanto occorre realizzare un impianto perfettamente equilibrato ed è sconsigliabile usare valvole di regolazione dei flussi. L’idraulico che doveva fare l’impianto iniziò il lavoro mentre non ero presente senza chiedermi come doveva operare. Anzi si fece fare i calcoli dell’impianto da un ingegnere che glielo fece assumendo che termoconvettori o radiatori fossero la stessa cosa. Quando arrivai in cantiere e vidi dei tubicini di rame che facevano giri strani dissi all’idraulico:

  • Smonta tutto perché quest’impianto non funziona.

Rispose:

  • Ma i calcoli li ha fatti un ingegnere esperto di impianti termici.

Gli replicai:

  • Quest’impianto è squilibrato e i termoconvettori più favoriti saranno caldi e gli altri freddi.

Capii che l’idraulico finalmente si spiegava perché di tutti gli impianti a termoconvettori che aveva montato nessuno funzionava bene.

Perciò aggiunsi:

  • Devi andare al centro della casa e staccare delle condotte identiche per tutti i termoconvettori.

L’idraulico era convinto, ma non si voleva arrendere e chiese:

  • E quali diametri devo mettere?

Risposi:

  • L’attacco dei termoconvettori è 1/2 pollice, quindi parti da questo con 1/2 pollice. Poi non ti devo insegnare io che quando incontrerai un altro 1/2 pollice dovrai mettere un tubo da 3/4 e così via.

In sostanza l’impianto funzionò da subito perfettamente e con una temperatura interna di 5° arrivava a 18° in meno di due ore. I termoconvettori mandavano aria calda riscaldando la casa uniformemente senza calcoli astrusi e modelli matematici complicati.

Se avessimo usato i calcoli numerici sofisticati dell’ingegnere “esperto” avremmo avuto grossi problemi a far salire la temperatura in alcune stanze in quanto era sbagliato il modello di calcolo.

Faccio osservare che l’uso di modelli errati nel caso dell’economia produce danni che possono distruggere il futuro di molte persone.

Questo è il testo dell’articolo di Russell.

THE MONIST – VOL. XXIV. Gennaio, 1914. NO. 1

SULLA NATURA DELLA CONOSCENZA. – DESCRIZIONE PRELIMINARE DELL’ ESPERIENZA.

Lo scopo di ciò che segue è quello di sostenere una sicura analisi degli aspetti più semplici e più penetranti dell’esperienza, vale a dire quello che io chiamo “conoscenza”. Sosterrò che la conoscenza è una relazione duale tra un soggetto e un oggetto che non devono avere alcuna natura comune. Il soggetto è “mentale”, l’oggetto non è noto per essere mentale, tranne nell’introspezione. L’oggetto può essere nel presente, nel passato, o per nulla affatto nel tempo; può essere un particolare sensibile, o un universale, o un fatto logico astratto. Tutte le relazioni cognitive – attenzione, sensazione, memoria, immaginazione, credere, non credere, ecc. – presuppongono la conoscenza.

Questa teoria deve essere difesa dalle tre teorie rivali: (I) la teoria di Mach e James, secondo la quale non vi è alcuna relazione distintiva come “conoscenza”, coinvolta in tutti i fatti mentali, ma solo un diverso raggruppamento degli stessi oggetti come quelli trattati dalle scienze non psicologiche; (2) la teoria che l’oggetto prossimo è mentale, così come il soggetto; (3) la teoria che tra soggetto e oggetto vi sia una terza entità, il “contenuto”, che è mentale, ed è questo il pensiero o stato della mente per mezzo del quale il soggetto apprende l’oggetto.

La prima di queste tesi avversarie è la più interessante e la più formidabile, e può essere affrontata solo per mezzo di  una discussione completa e dettagliata, che occuperà un secondo saggio. Le altre teorie, insieme con la mia, saranno considerate in un terzo saggio, mentre il primo saggio sarà costituito da un esame introduttivo di dati.

La parola “esperienza”, come la maggior parte delle parole che esprimono idee fondamentali in filosofia, è stata importata nel vocabolario tecnico dal linguaggio della vita quotidiana, e conserva qualcosa della sporcizia per la sua esistenza all’esterno nonostante qualche lavaggio e spazzolatura da filosofi insofferenti. In origine, la “filosofia dell’esperienza” era opposta alla filosofia a priori ‘, e l’ “esperienza” era confinata a ciò che apprendiamo attraverso i sensi. Gradualmente, tuttavia, il campo di applicazione è stato ampliato fino a comprendere tutto ciò di cui siamo in qualche modo coscienti, e divenne lo slogan di un idealismo svuotato di vigore importato dalla Germania. La parola aveva, da un lato, le associazioni rassicuranti del “ricorso per esperienza”, che sembrava precludere stravaganze selvagge di metafisici trascendentali; mentre d’altra parte teneva, per così dire in soluzione, la dottrina che nulla può accadere se non come “esperienza” di qualche mente. Così, con l’uso di questa sola parola gli idealisti astutamente costrinsero i loro antagonisti all’odio dell’a priori e all’apparente necessità di mantenere il vuoto dogma di una realtà inconoscibile, che deve, si pensava, essere del tutto arbitraria o non realmente inconoscibile .

Nella rivolta contro l’idealismo, sono state avvertite le ambiguità della parola “esperienza”, con il risultato che i realisti hanno sempre più evitato la parola. È da temere, tuttavia, che se viene evitata la parola le confusioni di pensiero con cui è stato associata possono persistere. Sembra meglio perseverare nel tentativo di analizzare e chiarire le idee un po’ vaghe e oscure comunemente chiamate con la parola “esperienza”, poiché non è improbabile che in questo processo possa venire avanti qualcosa di fondamentale importanza per la teoria della conoscenza.

Una certa difficoltà per quanto riguarda l’uso delle parole è inevitabile qui, come in tutte le indagini filosofiche. I significati delle parole comuni sono vaghe, fluttuanti e ambigue, come l’ombra gettata da un tremolante lampione in una notte di vento; ancora nel nucleo di questa incerto frammento di significato, possiamo trovare qualche preciso concetto per il quale la filosofia richiede un nome. Se scegliamo un nuovo termine tecnico, il collegamento con il pensiero ordinario è oscurato e la chiarificazione del pensiero ordinario è ritardata; ma se usiamo la parola comune con un nuovo preciso significato, possiamo sembrare in contrasto con l’uso, e possiamo confondere i pensieri del lettore con associazioni non pertinenti. E’ impossibile stabilire una regola per evitare questi pericoli opposti; a volte sarà bene introdurre un nuovo termine tecnico, a volte sarà meglio affinare la parola comune finché non diventi adatta agli utilizzi tecnici. Nel caso di “esperienza”, la seconda soluzione appare preferibile, poiché l’effettivo processo di affinamento della parola è istruttivo, e la confusione di pensiero che riveste non può ben essere altrimenti dissipata.

Nel cercare l’idea centrale compresa nella parola “esperienza”, staremmo allo stesso tempo effettuando le analisi necessarie per una definizione di “mente” e “mentale”.

Il senso comune divide gli esseri umani in anime e corpi, e la filosofia Cartesiana ha generalizzato questa divisione classificando tutto ciò che esiste o come mente o come materia.

Questa divisione è così familiare, e di tale rispettabile antichità, che è diventata parte delle nostre abitudini, e sembra quasi comprendere una teoria. La mente è ciò che conosciamo da dentro – pensieri, sentimenti e volizioni – mentre la materia è ciò che è nello spazio fuori dalla nostra mente. Tuttavia, quasi tutti i grandi filosofi fin da Leibniz hanno messo in discussione il dualismo fra mente e materia. La maggior parte di loro, per quanto riguarda la mente come qualcosa di immediatamente dato, l’hanno assimilata a quello che sembrava essere “materia”, e hanno così raggiunto il monismo dell’idealista. Possiamo definire un idealista come un uomo che crede che tutto ciò che esiste può essere chiamato “mentale”, nel senso di avere una certa qualità, nota a noi dall’introspezione come appartenente alle nostre menti. In tempi recenti, tuttavia, questa teoria è stata criticata da diversi punti di vista. Da un lato, gli uomini che hanno ammesso che conosciamo mediante introspezione gli oggetti aventi la qualità che chiamiamo “mentale” hanno insistito che conosciamo anche altri oggetti che non hanno questo carattere. D’altro canto, William James e i realisti americani hanno insistito che non vi è alcuna qualità specifica degli oggetti “mentali”, ma che gli oggetti che sono chiamati mentali sono identici agli oggetti che sono chiamati fisici, la differenza è solo quella del contesto e della disposizione.

Abbiamo quindi tre pareri da considerare. Ci sono in primo luogo quelli che negano che ci sia una qualità chiamata “mentale” che si rivela in introspezione. Questi uomini possono essere chiamati “monisti neutrali”, perché, pur respingendo la divisione del mondo in mente e materia, non dicono “tutta la realtà è la mente,” tuttavia non affermano che “tutta la realtà è materia.” Quindi, ci sono “idealisti monisti “, che ammettono una qualità chiamata” mentale “, e sostengono che ogni oggetto ha questa qualità.

Poi, ci sono i “dualisti”, che sostengono che vi è una tale qualità, ma che esistono oggetti che non la posseggono.

Per decidere tra questi punti di vista, è necessario decidere se si intende qualcosa con la parola “mentale”; e questa domanda ci riporta al significato di “esperienza”.

Quando consideriamo il mondo senza la conoscenza e l’ignoranza che vengono insegnate dalla filosofia, ci sembra di vedere che contiene una serie di oggetti e di persone, e che alcune delle cose vengono “sperimentate” da alcune delle persone. Un uomo può sperimentare oggetti diversi in tempi diversi, e diversi uomini possono sperimentare oggetti diversi allo stesso tempo. Alcune cose, come l’interno della terra o l’altra faccia della luna, non sono mai stati sperimentato da nessuno, ma comunque ritenuti che esistano. Le cose che un uomo si dice che esperimenti sono le cose che vengono fornite nelle sensazioni, i suoi pensieri e sentimenti (in ogni caso quanto egli ne è a conoscenza), e forse (anche se su questo punto il buon senso potrebbe esitare) i fatti che egli viene a sapere pensando.

In ogni momento, ci sono alcune cose di cui un uomo è “consapevole”, certe cose che sono “prima della sua mente.” Ora, anche se è molto difficile da definire “consapevolezza”, non è affatto difficile dire che io sono a conoscenza di queste e queste cose. Se mi viene chiesto, posso rispondere che io sono consapevole di questo e quello, e quell’altro, e così via attraverso una collezione eterogenea di oggetti. Se descrivo questi oggetti, io naturalmente li descrivo in modo errato; quindi non posso con certezza comunicare ad un altro quali sono le cose di cui sono a conoscenza. Ma se parlo a me stesso, e li indico con quelli che possono essere chiamati “nomi propri”, piuttosto che con le parole descrittive, non posso essere in errore. Finché i nomi che uso davvero sono i nomi al momento, ovvero, sono per me nomi di cose, purché le cose debbano essere oggetti di cui sono a conoscenza, dal momento che altrimenti le parole sarebbero suoni privi di significato, non nomi delle oggetti. Vi è quindi in un dato momento una certa riunione di oggetti a cui ho potuto, se l’ho scelto, dare nomi propri; questi sono gli oggetti della mia “consapevolezza” gli oggetti “prima della mia mente”, o gli oggetti che sono nella mia presente “esperienza”.

C’è una certa unità, importante da comprendere ma difficile da analizzare, nella “mia attuale esperienza.” Se abbiamo ipotizzato che “io” sono lo stesso in un certo istante e in un altro, potremmo supporre che “la mia attuale esperienza” potrebbe essere definita come tutta l’esperienza che “io” ho “ora.”Ma in realtà vedremo che “io” e “ora”, in relazione alla conoscenza, devono essere definiti nei termini di “la mia attuale esperienza”, piuttosto che viceversa. Inoltre, non possiamo definire “la mia attuale esperienza” come “tutte le esperienze contemporanee con questo” (se questa è una qualche parte reale di ciò che ora sperimento), dal momento che sarebbe ignorare la possibilità di esperienze diverse dalle mie. Né possiamo definire come “tutte le esperienze che ho conosciuto come contemporanea con questa,” dal momento che escluderebbe tutte quelle parti della mia esperienza, di cui io non divento introspettivamente cosciente. Dovremo dire, credo, che “stare sperimentando insieme” è una relazione tra gli oggetti dell’esperienza, che possono a loro volta essere sperimentati, per esempio quando ci si rende conto di due cose che stiamo vedendo insieme, o di una cosa vista e di una cosa sentita contemporaneamente.

Avendo imparato a conoscere in questo modo cosa si intende per “sperimentare insieme,” possiamo definire “i miei contenuti attuali di esperienza” come “ogni cosa sperimentata insieme a questo,” ove ciò sia qualsiasi cosa sperimentata con l’attenzione. Torneremo su questo argomento in diverse occasioni successive.

Non mi propongo ancora di tentare una analisi logica di “esperienza.” Per il momento, vorrei prendere in considerazione la sua estensione, i suoi confini, il suo prolungamento nel tempo, e le ragioni per ritenerla come non onnicomprensiva. Questi argomenti possono essere trattati mediante la discussione in successione delle seguenti domande: (1) le sensazioni deboli e periferiche sono incluse nell’ “esperienza”? (2) Tutte o alcune delle nostre attuali convinzioni vere sono incluse nella presente “esperienza”? (3) Facciamo ora “esperienza” di oggetti del passato che ricordiamo? (4) Come veniamo a sapere che il gruppo di cose ora sperimentato non è il tutto? (5) Perché consideriamo le nostre esperienze presenti e passate, come tutte le parti di una sola esperienza, vale a dire l’esperienza che chiamiamo “nostra”? (6) Cosa è che che ci porta a credere che la “nostra” totale esperienza non è un’esperienza onnicomprensiva? Molte di queste domande dovranno essere di nuovo discusse più completamente in una fase successiva; per il momento, non le stiamo discutendo sotto ogni aspetto, ma per acquisire familiarità con il concetto di esperienza.

1. Le sensazioni deboli e periferiche sono incluse nell’ “esperienza”? Questa domanda può essere fatta, non solo per quanto riguarda le sensazioni, ma anche per desideri vaghi, pensieri oscuri, e quant’altro non è al centro dell’attenzione; ma a titolo illustrativo, il caso della sensazione, che è la più semplice, può essere sufficiente. Per motivi di determinatezza, consideriamo il campo visivo. Normalmente, se stiamo assistendo a qualcosa che riguarda il vedere, è a ciò che è al centro del campo che noi partecipiamo, ma possiamo, con uno sforzo di volontà, partecipare a ciò che è al margine. E’ ovvio che, quando lo facciamo, quello di cui ci occupiamo è indubbiamente esperienza.

Così la domanda che dobbiamo considerare è se l’attenzione costituisce esperienza, o se le cose a cui non partecipiamo sono pure esperienza. Sembra che dobbiamo ammettere le cose a cui noi non partecipiamo, perché l’attenzione è una selezione tra gli oggetti che sono “prima nella mente”, e quindi presuppone un campo più ampio, costituito in qualche modo meno esclusivo, di cui l’attenzione sceglie quello che vuole. Nei casi, invece, dove, nonostante le condizioni fisiche che potrebbero essere suscettibili di produrre una sensazione, nessuna sensazione sembra sussistere, come per esempio quando non riusciamo a sentire un suono debole che dovremmo sentire se la nostra attenzione fosse stata richiamata su questo, sembrerebbe che non ci sia una corrispondente “esperienza”; in tali casi, nonostante l’esistenza fisica del suono-stimolo, non sembra esserci talvolta nessuna risposta “mentale”.

2. La nostra vita mentale è in gran parte composta di convinzioni, e di ciò che ci piace chiamare “conoscenza” dei “fatti”.

Quando parlo di un “fatto”, intendo il genere di cosa che si esprime con la frase “questo così e così è il caso.” Un “Fatto” in questo senso è qualcosa di diverso da un oggetto sensibile esistente; è il tipo di oggetto verso cui abbiamo una convinzione, espressa con una proposizione. La domanda che mi sto facendo adesso non è se credere è esperienza, perché questo lo assumo che sia  ovvio; la domanda è, se i fatti verso i quali sono dirette le convinzioni sono mai esperienza. E’ evidente immediatamente che la maggior parte dei fatti che riteniamo essere nella nostra conoscenza non sono ottenuti con l’esperienza. Noi non facciamo esperienza che la terra gira intorno al sole, o che Londra ha sei milioni di abitanti, o che Napoleone è stato sconfitto a Waterloo. Penso, tuttavia, che alcuni fatti sono dovuti all’esperienza, cioè quelli che vediamo noi stessi, senza fare affidamento né sui nostri ragionamenti derivanti da fatti precedenti, o sulla testimonianza degli altri. Questi fatti “primitivi”, che sono noti a noi da una visione immediata luminosa e indubitabile come quella di un senso, devono, se non erro, essere inclusi nella materia originale dell’esperienza. La loro importanza nella teoria della conoscenza è molto grande, e avremo occasione di considerarle molto completamente nel seguito.

3. Dobbiamo ora sperimentare le cose del passato che ricordiamo? Non possiamo ovviamente discutere di questo problema in modo adeguato, senza una analisi della psicologia della memoria. Ma in una breve via preliminare, qualcosa si può dire per indicare una conclusione positiva. In primo luogo, non dobbiamo confondere vera memoria con le immagini attuali di cose passate. Posso richiamare ora alla mia mente l’immagine di un uomo che ho visto ieri; l’immagine non è nel passato, e certamente ne faccio esperienza adesso, ma l’immagine in sé stessa non è memoria.

Il ricordo si riferisce a qualcosa di noto per essere nel passato, per quello che ho visto ieri, non l’immagine che io richiamo adesso. Ma anche quando l’immagine attuale è stato messa via come irrilevante, rimane ancora una distinzione tra ciò che può essere chiamata memoria “intellettuale” e ciò che può essere chiamato memoria “di sensazione”. Quando soltanto so “che ho visto ieri Jones,” questa è memoria intellettuale; la mia conoscenza è uno di questi “fatti primitivi”, che abbiamo considerato nel paragrafo precedente. Ma nella memoria immediata di qualcosa che è appena successo, la cosa stessa sembra rimanere nell’esperienza, nonostante il fatto che è nota per non essere più presente. Quanto tempo questo tipo di memoria può durare, io non pretendo di sapere; ma può certamente durare abbastanza a lungo per farci consapevoli di un lasso di tempo da quando la cosa ricordata era presente.

Così sembrerebbe che in due diversi modi le cose del passato possono formare parti di esperienze presenti.

La conclusione che le cose passate sono sperimentate nella memoria può essere rafforzata considerando la differenza tra passato e futuro. Attraverso la previsione scientifica, possiamo arrivare a conoscere, con maggiore o minore probabilità, molte cose per il futuro, ma tutte queste cose sono supposte: nessuna di esse è nota al momento attuale. Noi non sappiamo nemmeno adesso cosa si intende con la parola “futuro”: il futuro è essenzialmente quel periodo di tempo in cui il presente sarà passato. “Presente” e “passato” sono dati dall’esperienza, e “futuro” è definito nei termini di questi. La differenza tra passato e futuro, dal punto di vista della teoria della conoscenza, consiste proprio nel fatto che il passato è in parte sperimentato ora, mentre il futuro rimane ancora totalmente al di fuori dell’esperienza.

4. Come veniamo a sapere che il gruppo di cose ormai sperimentato non riguarda la totalità? Questa domanda sorge spontanea su quanto è stato appena detto riguardo il futuro; perché la nostra convinzione che ci sarà un futuro è solo una cosa che ci porta al di là dell’esperienza presente. Non è, tuttavia, una delle più indubbbie; non abbiamo alcuna buona ragione per sentirci sicuri che ci sarà un futuro, mentre alcuni dei modi in cui la realtà deve trascendere l’esperienza presente sembrano certi come qualsiasi conoscenza.

La domanda è di grande importanza, perché ci introduce a tutto il problema di come la conoscenza può trascendere l’esperienza personale. Per il momento, però, non siamo interessati a tutta la nostra esperienza individuale, ma solo all’esperienza di un dato momento.

A prima vista potrebbe sembrare come se l’esperienza di ogni momento debba essere una prigione per la conoscenza di quel momento, e come se i suoi confini debbano essere i confini del nostro mondo attuale. Ogni parola che ora capiamo deve avere un significato che ricade all’interno della nostra esperienza presente; non possiamo mai indicare un oggetto e dire: “. Questo si trova fuori dalla mia attuale esperienza”. Non possiamo conoscere qualsiasi oggetto particolare a meno che sia parte della presente esperienza; quindi si potrebbe dedurre che non possiamo sapere che ci sono cose particolari che esulano dall’esperienza presente. Il supporre che possiamo sapere questo, si potrebbe dire, è supporre che possiamo conoscere ciò che non conosciamo. Su questa base, possiamo essere spinti ad un modesto agnosticismo per quanto riguarda tutto ciò che si trova fuori dalla nostra coscienza momentanea. Un tale punto di vista, è vero, di solito non è sostenuto in questa forma estrema; ma i principi del solipsismo e della vecchia filosofia empirica sembrerebbero, se applicati rigorosamente, ridurre la conoscenza di ogni momento entro il campo ristretto dell’esperienza del momento.

Per questa teoria ci sono due repliche complementari.

Una è empirica, e consiste nel sottolineare che in realtà conosciamo più di quello che la teoria suppone; l’altro è logico, e consiste nell’indicare un errore nell’inferenza che la teoria trae dai dati. Cominciamo con la confutazione empirica.

Una delle ovvie confutazioni empiriche deriva dalla consapevolezza che abbiamo dimenticato qualcosa.

Quando, per esempio, cerchiamo di ricordare il nome di una persona, possiamo essere assolutamente certi che il nome è entrato nella nostra esperienza in passato, ma per quanti sforzi facciamo non entrerà nella nostra esperienza attuale. Quindi di nuovo, in più regioni astratte sappiamo che ci sono fatti che non sono all’interno della nostra esperienza attuale; possiamo ricordare che ci sono 144 voci nella tavola delle tabelline, senza ricordarle tutte individualmente; e possiamo sapere che ci sono un numero infinito di fatti nell’aritmetica, di cui solo un numero finito sono ora presenti alla nostra mente. In entrambi i casi di cui sopra, abbiamo la certezza, ma in un caso la cosa dimenticata una volta ha fatto parte della nostra esperienza, mentre nell’altro, il fatto non sperimentato è un fatto matematico astratto, non è un oggetto particolare esistente nel tempo. Se siamo disposti ad ammettere qualsiasi delle credenze della vita quotidiana, come ad esempio che ci sarà un futuro, noi ovviamente abbiamo una grande estensione di ciò che esiste, senza essere sperimentato. Sappiamo dalla memoria che finora abbiamo sempre preso coscienza, nella sensazione, di nuovi particolari non sperimentati prima, e che quindi tutta la nostra esperienza passata non sia la totalità dei fatti. Se, poi, il momento presente non è l’ultimo momento della vita dell’universo, dobbiamo supporre che il futuro conterrà cose che noi non sperimentiamo ora. Non è una risposta il dire che, dal momento che queste cose sono il futuro, non fanno ancora parte dell’universo; esse devono, in ogni istante, essere incluse in qualsiasi inventario completo dell’universo, che deve enumerare ciò che è deve succedere tanto quanto ciò che è e ciò che è stato. Per le ragioni di cui sopra, allora, è certo che il mondo contiene alcune cose non nella mia esperienza, ed è molto probabile che contenga un gran numero di queste cose.

Resta da dimostrare la possibilità logica della conoscenza che ci sono cose che non stiamo ora sperimentando. Questo dipende dal fatto che noi possiamo conoscere proposizioni del tipo: “Ci sono oggetti che hanno tale e tale proprietà”, anche quando non sappiamo di alcun caso di queste cose. Nel mondo matematico astratto, è molto facile trovarne esempi. Per esempio, sappiamo che non esiste il più grande numero primo. Ma di tutti i numeri primi che avremo mai pensato, vi è certamente uno più grande. Quindi ci sono numeri primi maggiori di quelli che avremo mai pensato. Ma in termini più concreti, lo stesso è vero: è perfettamente possibile sapere che ci sono cose che ho conosciuto, ma ora ho dimenticato, anche se ovviamente è impossibile fornire un esempio di queste cose. Per ricorrere al nostro esempio precedente, posso ricordare perfettamente che ieri ho saputo il nome della signora che mi hanno presentato, anche se oggi ne ho dimenticato il nome. Che mi sia stato detto il suo nome, è un fatto che io conosco, e che implica che io sapevo una cosa particolare che non so più; so che c’era una cosa particolare, ma io non so quale cosa particolare fosse. Proseguire questo argomento più oltre richiederebbe una relazione sulla “conoscenza per descrizione”, che appartiene ad una fase successiva. Per il momento, io sono soddisfatto di aver fatto notare che sappiamo che ci sono cose al di fuori dell’esperienza presente e che tale conoscenza non solleva difficoltà logiche.

5. Perché consideriamo le nostre esperienze presenti e passate, come tutte le parti di una sola esperienza, vale a dire l’esperienza che chiamiamo “nostra”? Questa domanda deve essere considerata prima di poter passare alla ulteriore domanda, se possiamo sapere che ci sono cose che trascendono tutta la “nostra” esperienza. Ma al nostro attuale stadio possiamo fornire solo una breve osservazione preliminare, tale che ci permetterà di parlare della totale esperienza di una persona con una certa comprensione di ciò che intendiamo e quali sono le difficoltà che comporta.

E‘ ovvio che la memoria è ciò che chiamiamo esperienze passate “nostre.” Io non intendo dire che solo le esperienze che noi ora ricordiamo sono considerate come la nostre, ma che la memoria costruisce sempre gli anelli della catena che lega il nostro presente con il nostro passato. Non è, tuttavia, la memoria di per sé che fa questo: è una memoria di un certo tipo. Se ci limitiamo a ricordare qualche oggetto esterno, l’esperienza è nel presente, e non vi è ancora alcun motivo di assumere l’esperienza passata. Sarebbe logicamente possibile ricordare un oggetto che non avessimo mai sperimentato; anzi, non è affatto certo che questo a volte non si verifichi. Possiamo sentire un orologio a suoneria, per esempio, e rendersi conto che ha già suonato diverse volte prima che l’avessimo notato. Forse, in questo caso, abbiamo effettivamente sperimentato i rintocchi precedenti al momento in cui si sono verificati, ma non possiamo ricordare di averlo fatto. Così il caso serve ad illustrare una differenza importante, ossia la differenza tra ricordare un evento esterno e il ricordare la nostra esperienza dell’evento. Normalmente, quando ricordiamo un evento, ricordiamo anche la nostra esperienza di esso, ma le due sono memorie differenti, come dimostra il caso dell’orologio a suoneria. La memoria che prolunga la nostra personalità a ritroso nel tempo è la memoria della nostra esperienza, non solo delle cose che abbiamo sperimentato. Quando possiamo ricordare di aver sperimentato qualcosa, includiamo l’esperienza ricordata con la nostra presente esperienza come parte dell’esperienza di una persona.

Così siamo portati a includere anche qualsiasi esperienza avessimo ricordato nel periodo precedente, e così indietro, ipoteticamente, fino alla prima infanzia. Allo stesso modo ipotetico, abbiamo tratto la nostra personalità in avanti nel tempo per tutte le esperienze che ricorderanno le nostre esperienze presenti direttamente o indirettamente. 1

1 Nel linguaggio della logica delle relazioni, se M è la relazione “ricordare”, N la somma di M e della sua inversa, e r è un momento di esperienza, l’esperienza totale a cui appartiene x sono tutti i momenti di esperienza che hanno con x la relazione N *. Cfr. Principia Mathematica, * 90.

Con questa estensione dell’esperienza presente in una serie di esperienze legate dalla memoria, includiamo nella nostra esperienza totale tutte quelle particolari, di cui si parla sotto l’ultimo nostro titolo, che sono note per essere esistite, anche se non fanno parte dell’esperienza presente; e nel caso il tempo dovesse continuare oltre il momento presente, includiamo anche quelle future esperienze che saranno collegate al nostro presente come il nostro presente è collegato al nostro passato.

6. Cosa ci porta a credere che la “nostra” esperienza complessiva non comprende tutto? Questa è la domanda del solipsismo: Che ragione abbiamo per credere che qualche cosa esista o sia esistita o esisterà tranne ciò che fa parte della nostra esperienza complessiva, nel senso spiegato nel paragrafo precedente?

L’argomentazione logica con cui abbiamo dimostrato che è possibile conoscere l’esistenza di cose che sono fuori dell’esperienza presente si applica, senza modifiche, all’esistenza di cose che si trovano al di fuori della nostra esperienza complessiva. Quindi l’unica domanda che dobbiamo considerare è se, come dato di fatto empirico, sappiamo tutto ciò che dimostra l’esistenza di tali cose. Nell’area della logica matematica astratta, è facile, per mezzo degli esempi stessi che abbiamo usato prima, dimostrare che ci sono fatti che non fanno parte della nostra esperienza complessiva. Sembra certo che non possiamo pensare più di un numero finito di fatti aritmetici nel corso della nostra vita, e sappiamo che il numero totale dei fatti aritmetici è infinita. Se questo esempio venisse considerato non conclusivo, per il fatto che forse sopravviviamo alla morte e diventeremmo più interessati all’aritmetica di seguito, il seguente esempio sarà trovato più pertinente. Il numero di funzioni di una variabile reale è infinitamente maggiore del numero degli istanti di tempo.

Quindi anche se spendessimo tutta l’eternità a pensare una nuova funzione ogni istante, o un piccolo infinito numero di nuove funzioni ogni istante, ci sarebbe ancora un numero infinito di funzioni che non avremmo pensato, e quindi un infinito numero di fatti su cui non entrerebbe mai la nostra esperienza. E’ quindi certo che ci sono fatti matematici che non entrano nella nostra esperienza totale.

Per quanto riguarda i particolari esistenti, un tale argomento convincente, per quanto ne so, può essere prodotto. Noi naturalmente supponiamo che i corpi di altre persone siano abitati da menti più o meno come la nostra, che sperimentano piaceri e dolori, desideri e avversioni, di cui non abbiamo consapevolezza diretta. Ma anche se noi naturalmente supponiamo questo, e anche se non possiamo attribuire nessuna ragione per credere che la nostra supposizione è errata, tuttavia sembrerebbe anche che non vi è motivo determinante per ritenere che non è  un errore. Esattamente lo stesso grado di dubbio è connesso con l’interno della terra, l’altra faccia della luna, e innumerevoli fatti fisici che abitualmente assumiamo senza la garanzia dell’esperienza diretta. Se ci sono buone ragioni per credere in qualsiasi di queste cose, ciò deve derivare dall’induzione e la causalità con un processo complicato che non siamo attualmente in grado di prendere in considerazione. Per il momento, assumiamo come ipotesi di lavoro l’esistenza di altre persone e delle cose fisiche non percepibili. Di tanto in tanto dobbiamo rivedere questa ipotesi, e alla fine saremo in grado di farci un’idea degli elementi di prova circa la sua verità.

Per il momento, dobbiamo essere soddisfatti con le conclusioni: (a) che non vi è alcuna ragione logica contro di essa, (b) che nel mondo logica ci sono certamente fatti di cui non facciamo esperienza, (c) che il presupposto senso comune che vi sono particolari di cui non abbiamo esperienza è stata trovato come un assoluto successo come ipotesi di lavoro, e che non vi è alcun argomento di qualsiasi tipo o genere contro di esso.

La conclusione a cui siamo stati guidati dalla discussione di cui sopra è che alcune delle cose del mondo, ma non tutte, sono raccolte insieme in ogni momento della mia vita cosciente in un gruppo che può essere chiamato “la mia attuale esperienza”; che questo gruppo comprende le cose esistenti ora, cose che esistevano in passato, e fatti astratti; anche che nella mia esperienza di una cosa, è coinvolto qualcosa di più del semplice oggetto, e può essere sperimentato nella memoria; che in tal modo un gruppo completo delle mie esperienze nel corso del tempo può essere definito mediante la memoria, ma che questo gruppo, come gruppo momentaneo, di certo non contiene tutti i fatti astratti, e sembra non contenere tutti i particolari esistenti, e specialmente non contenere l’esperienza che crediamo essere associata con i corpi delle altre persone.

Ora dobbiamo considerare cosa è l’analisi di “sperimentare” i. e., qual è il legame che unisce certi oggetti nel gruppo che costituisce una esperienza momentanea.

E qui dobbiamo prima considerare la teoria che abbiamo chiamato “monismo neutrale,” dovuta a William James; perché le domande sollevate da questa teoria sono così fondamentali che fino a che non trovano risposta, in un modo o in un altro, non possono essere fatti ulteriori progressi.

BERTRAND RUSSELL.

CAMBRIDGE, Inghilterra.

The Foundation of Mathematics di Frank Ramsey – Capitolo IX Last papers – Sezione A Theories

24 Giu

foto0004Riporto di seguito la traduzione della sezione A del capitolo IX (Last papers) di The Foundation of Mathematics pubblicato a cura di R.B. Braithwaite. Si tratta di un appunto, non pubblicato in precedenza, che riguarda i metodi di valutazione della costruzione corretta di teorie scientifiche. E’ interessante il rigore del sistema deduttivo e la coerenza con il metodo del Realismo.

IX

ULTIMI ARTICOLI ( 1929)

A. TEORIE

Proviamo a descrivere una teoria semplicemente come un linguaggio per discutere i fatti che la teoria si dice che spieghi. Questo non ci richiede di impegnarci sulla questione filosofica se una teoria è solo un linguaggio, ma piuttosto se sapevamo che tipo di linguaggio sarebbe se si trattasse effettivamente di un linguaggio, potremmo essere favoriti nella scoperta se ce ne è uno. Dobbiamo cercare di rendere la nostra considerazione più generale possibile, ma non possiamo essere sicuri che abbiamo infatti raggiunto il tipo più generale di teoria, dal momento che la complicazione possibile è infinita. In primo luogo, consideriamo i fatti da spiegare. Questi si verificano in un universo di discorso che chiameremo il sistema primario, essendo questo sistema composto di tutti i termini 1 e proposizioni (veri o falsi) nell’universo in questione. Dobbiamo supporre che il sistema primario in qualche modo ci è dato in modo che abbiamo una notazione in grado di esprimere in esso qualsiasi proposizione. Di che tipo deve essere questa notazione? 1 L’ ‘ universo ‘ del sistema primario potrebbe contenere ‘ blu o rosso ‘, ma non ‘blu’ o ‘ rosso’; cioè potremmo dichiarare di spiegare quando una cosa fosse ‘ blu o rossa ‘ rispetto a ‘ verde o gialla’, ma non che era , blu o rosso . ‘ Blu o rosso ‘ sarebbe allora un termine : ‘blu’ , ‘rosso’ un nonsenso per il nostro scopo attuale . Potrebbe nel primo caso consistere di nomi di diversi tipi di cui due o più congiunti insieme hanno dato una proposizione atomica; per esempio, i nomi: a , b . . . z , ‘rosso’ , ‘prima’ . Ma penso che i sistemi che cerchiamo di spiegare sono raramente di questo tipo; se per esempio ci occupiamo di una serie di esperienze, non cerchiamo di spiegare il loro ordine temporale (che non potremmo spiegare con qualcosa di più semplice) o anche, nell’ipotesi un ordine, se si tratta che viene prima a di b; diamo per scontato che esse siano in un ordine e che a viene prima di b, ecc., e cerchiamo di spiegare quale è rosso, quale blu, ecc. a è essenzialmente una cosa prima di b , e ‘a’ , ‘b’, ecc., non sono in realtà i nomi, ma le descrizioni, tranne nel caso del presente. Diamo per scontato che queste descrizioni descrivono univocamente, e invece di ‘ a era rosso ‘ abbiamo ad esempio ‘ Il 3 ° da qui era rosso ‘. I simboli che vogliamo non sono nomi , ma numeri: lo 0 ( cioè il presente) , 1°, – 1° , ecc., in generale l’ ennesimo, e possiamo usare rosso (n) per indicare che l’ennesimo è rosso contando in avanti o indietro da un luogo particolare. Se la serie termina per dire a 100, potremmo scrivere N (101), e in generale N (m) se m > 100 , significherebbe ‘Non c’è un emmesimo ‘; oppure semplicemente considerare ad esempio rosso (m) come un nonsenso se m > 100, mentre se abbiamo scritto N (m) dovremmo dire che rosso (m) era falso. Io non sono sicuro che questo è necessario, ma mi sembra sempre così, in pratica; cioè i termini del nostro sistema primario hanno una struttura e qualsiasi struttura può essere rappresentata da numeri (o coppie o altre combinazioni di numeri). Potrebbe essere possibile andare oltre questo, perché dei termini nel nostro sistema primario non solo alcuni, ma proprio tutti possano essere meglio simboleggiati dai numeri. Per esempio, i colori hanno una struttura, a cui un dato colore può essere assegnata una posizione mediante tre numeri, e così via. Anche gli odori possono essere trattati così: la presenza dell’odore verrebbe indicata con 1, l’ assenza da 0 (o tutte le qualità totale dell’odore possono essere date da numeri). Naturalmente, non possiamo comprendere una proposizione di numeri senza qualche collegamento. Il momento 3 che ha colore 1 Odore e 2 deve essere scritto χ ( 3 ) = 1 e φ ( 3) = 2 , corrispondendo χ e φ alle forme generali di colore e odore, ed essendo possibilmente funzioni con un numero limitato di valori, in modo che ad esempio φ (3) = 55 potrebbe essere un nonsenso, perché non esiste nessun 55esimo odore. In entrambi i casi questo è possibile, non è così vantaggioso dove abbiamo relativamente pochi termini (per esempio, un paio di odori) da affrontare. Dove abbiamo una moltitudine come ad esempio con i tempi, a cui non possiamo dare un nome, e la nostra teoria non esprime un sistema primario in cui essi hanno nomi, perché non assumono affatto un valore in relazione alla loro individualità, ma solo in relazione alla loro posizione. In generale non si guadagna nulla e la chiarezza può essere persa utilizzando i numeri quando l’ordine, ecc., dei numeri non corrisponde a nulla nella natura di questi termini. Se tutti i termini fossero rappresentati da numeri, le proposizioni del sistema primario prenderebbero tutte la forma di affermazioni assunte da certe funzioni numeriche ad un valore. Queste non sarebbero funzioni matematiche nel senso comune; perché una tale funzione che abbia questo o quel valore sarebbe sempre un dato di fatto, non una questione di matematica. Abbiamo parlato come se i numeri coinvolti fossero sempre interi, e se i finitisti fossero nel giusto proprio così dovrebbe effettivamente essere nel sistema primario finale, anche se i numeri interi possono, ovviamente, assumere la forma di razionali. Questo significa che possiamo occuparci di coppie ( m, n) con ( λm , λn ) sempre identiche a (m , n). Se, tuttavia , il nostro sistema primario è già un sistema secondario per qualche altra teoria, potrebbero presentarsi dei numeri reali. Questo per quanto riguarda il sistema primario; ora la costruzione teorica . Inizieremo prendendo una forma tipica di teoria, e considereremo in seguito se questa forma è la più generale. Supponiamo che le proposizioni atomiche del nostro sistema primario siano del tipo A ( n ) , B ( m , n ) . . . dove m , n , ecc., assumono valori interi positivi o negativi soggetti a qualche restrizione, ad esempio che in B ( m , n ) m può assumere solo i valori 1, 2. Quindi introduciamo le nuove funzioni proposizionali α ( n ) , β ( n ) , γ ( m , n ) , ecc., e con proposizioni del sistema secondario intenderemo qualsiasi funzioni verità dei valori di α , β , γ , ecc. Dovremo inoltre stabilire proposizioni su questi valori, ad esempio, Schermata 2014-03-07 alle 20.39.48 che chiameremo assiomi, e qualsiasi proposizione del sistema secondario potranno essere dedotte dagli assiomi che chiameremo teoremi. Oltre a questo costruiremo un dizionario che assume la forma di una serie di definizioni delle funzioni del sistema primario A , B , C. . . . nei termini di quelle del sistema secondario α , β , γ , ad esempio A ( n ) = α ( n ) . v . γ ( 0 , n2 ). Prendendo queste ” definizioni ” come equivalenze e aggiungendole agli assiomi potremmo essere in grado di dedurre proposizioni del sistema primario che chiameremo leggi se sono proposizioni generali, conseguenze se sono singolari. La totalità delle leggi e delle conseguenze sarà l’eliminante (risultante dall’eliminazione di variabili da un sistema di equazioni) quando α , β , γ . . , ecc., vengono eliminate dal dizionario e dagli assiomi, e questa è quella totalità di leggi e di conseguenze che la nostra teoria afferma essere vera. Possiamo rendere questo più chiaro con un esempio 1; interpretiamo i numeri n , n1, n2 , ecc., come istanti di tempo e supponiamo che il sistema primario contenga le seguenti funzioni : – A ( n) = vedo blu all’istante n . B ( n) = Vedo rosso all’istante n . Schermata 2014-03-12 alle 18.07.16 traduzione C ( n) = Tra n-1 e n sento i miei occhi aperti . D ( n) = Tra n-1 e n sento i miei occhi chiusi. E ( n) = muovo un passo avanti all’istante n . F ( n) = mi sposto di un passo indietro all’istante n . 1 [ L’esempio sembra futile, quindi provo a inventarne uno migliore; ma in realtà mette in evidenza alcuni buoni punti, che sarebbe difficile altrimenti evidenziare. Esso può tuttavia non considerare alcuni punti che prenderemo in considerazione più avanti. Un difetto in tutti gli esempi di Nicod è che non danno un mondo esterno in cui qualche cosa accade. – F. P. R. ] e così costruiamo una teoria nel modo seguente: Per prima cosa m sarà sottinteso che prendendo esclusivamente i valori 1 , 2 , 3, Schermata 2014-03-07 alle 20.49.55 traduzione Questa teoria si può dire che rappresenti me che si muove tra 3 luoghi, essendo ‘ avanti ‘ nella direzione ABCA, ‘ indietro’ nella direzione ACBA. Il luogo A è sempre blu, il luogo B alternativamente blu e rosso, il luogo C blu o rosso in base a una legge che non ho scoperto. Se i miei occhi sono aperti vedo il colore del posto in cui mi trovo, se sono chiusi non vedo nessun colore. Le leggi risultanti dalla teoria possono essere espresse come segue: Schermata 2014-03-07 alle 20.53.27 ( 21) ( 2) con C e D invertiti Definiamo che 0 (n1 , n2 ) significa 1 2 Schermata 2014-03-07 alle 20.55.53 traduzione Questi possono poi essere confrontati con gli assiomi e il dizionario, e non c’è dubbio che per una normale intelligenza gli assiomi e il dizionario forniscono le leggi in una forma più gestibile. Mettiamo ora tutto in forma matematica , scrivendo Schermata 2014-06-22 alle 21.36.54 traduzione Schermata 2014-03-12 alle 18.48.16 traduzione Invece di α ( n , m ) abbiamo  α ( n) una funzione che assume i valori 1, 2, 3 Invece di β ( n , m ) abbiamo β ( n , m )  una funzione che assume i valori 1 , -1 Invece di γ ( n ) abbiamo  γ ( n ) una funzione che assume i valori   1 ,  0 I nostri assiomi sono proprio Schermata 2014-03-07 alle 21.04.05 Schermata 2014-03-07 alle 21.04.11 Di questi ( 1) ( 4) ( 5) difficilmente contano in quanto si limitano a dire quali valori le funzioni sono in grado di assumere. Le nostre definizioni diventano . Schermata 2014-03-07 alle 21.04.18 traduzione Le nostre leggi sono , naturalmente, che φ , χ , ψ devono essere tali che α , β , γ debbono soddisfare 1-5 , i- iii . Passando attraverso le vecchie leggi che invece avevamo Schermata 2014-03-07 alle 21.04.25 traduzione Schermata 2014-03-07 alle 21.08.10 Finora abbiamo mostrato solo la formazione delle leggi; le conseguenze sorgono quando si aggiunge agli assiomi una proposizione che coinvolge ad esempio un particolare valore di n, da cui possiamo dedurre proposizioni nel sistema primario non della forma ( n) . . . Noi chiamiamo queste le conseguenze. Se la prendiamo nella sua forma matematica possiamo spiegare l’idea di una teoria come segue: Invece di dire semplicemente ciò che sappiamo circa i valori delle funzioni con le quali siamo interessati, diciamo che esse possono essere costruite in un definito modo reso noto dal dizionario di funzioni che soddisfano determinate condizioni date dagli assiomi. Tale è allora un esempio di una teoria; prima di andare a discutere in modo sistematico le diverse caratteristiche dell’esempio e se si verificano in qualsiasi teoria, prendiamo alcune domande che potrebbero essere poste sulle teorie e vedere come verrebbero risolte nel presente caso. 1. Possiamo dire qualche cosa nel linguaggio di questa teoria che non potremmo dire senza di essa? Ovviamente no; perché si possono facilmente eliminare le funzioni del secondo sistema e così dire nel sistema primario tutto ciò che questa teoria ci fornisce. 2 . Possiamo riprodurre la struttura della nostra teoria per mezzo di definizioni esplicite all’interno del sistema primario? [ Questa domanda è importante perché Russell , Whitehead , Nicod e Carnap sembrano tutti supporre che possiamo e dobbiamo farlo.1 ] Qui ci sono alcune distinzioni da fare. Potremmo, per esempio, ragionare come segue. Supponendo che le leggi e le conseguenze siano vere, i fatti del sistema principale devono essere tali da consentire che le funzioni siano definite con tutte le proprietà di quelle del sistema secondario, e queste fornire la soluzione del nostro problema. Ma il problema è che le leggi e le conseguenze possono essere rese vere da un numero di differenti insiemi di fatti, che corrispondono a ciascuno di quelli per cui potremmo avere definizioni diverse. Così che il nostro problema di trovare un unico insieme di definizioni che rendono il dizionario e gli assiomi veri quando le leggi e le conseguenze sono vere, è ancora irrisolto. Possiamo, tuttavia, allo stesso tempo risolverlo formalmente, scindendo gli insiemi di definizioni precedentemente ottenute; cioè se i vari insiemi di fatti che soddisfano le leggi e le conseguenze sono P1 , P2 , P3 , e le corrispondenti definizioni di α ( n , m ) sono α( n , m ) = L1 { A, B , C. . . , N , m } L2 { A, B , C , . . , N , m } ecc. poniamo la definizione α ( n , m ) = P1 ⊃ L1 { A , B , C . . . n , m } . P2 ⊃ L2 { A , B , C . . . n , m } . eccetera. Tale definizione è formalmente valida e soddisfa evidentemente le nostre richieste. 1 Jean Nicod , La Géométrie dans le Monde Sensible (1924), tradotto nei suoi Problems of Geometry and Induction (1930): Rudolf Carnap, Der Logische  Aufbau der Welt (1928) . Quello che può essere contestato a questo è la complessità e l’arbitrarietà, dal momento che L1, L2 . . . probabilmente possono essere scelti ciascuno in molti modi . Inoltre assume esplicitamente che il nostro sistema primario è finito e contiene un numero definito di proposizioni atomiche assegnabili. Vediamo dunque quali altri modi di procedere ci siano. Potremmo a prima vista supporre che la chiave stia semplicemente nel dizionario; questo dà le definizioni di A , B , C . . . in termini di α , β , γ . . . Possiamo invertirlo per ottenere le definizioni di α , β , γ . . . in termini di A , B , C . . . ? O, in forma matematica, non possiamo risolvere le equazioni di α , β , γ . . . in termini di φ , χ , ψ . . . , comunque, se si aggiungono al dizionario, come possiamo legittimamente, quelle leggi e assiomi che semplicemente definiscono quali valori le funzioni sono in grado di assumere? Quando, però, osserviamo quelle equazioni ( i) , ( ii ) , ( iii ) ciò che troviamo è questo: Se trascuriamo le limitazioni nei valori delle funzioni che possiedono una soluzione integrale a condizione che γ ( n) può essere trovata da ( ii ) in modo da essere sempre un fattore di φ ( n ), cioè in generale sempre essere ± 1 o 0 e mai annullarsi a meno che φ ( n ) si annulli. Questo è, ovviamente, solo vero in virtù delle condizioni previste per φ e χ dalle leggi; assumendo queste leggi e la limitazione sui valori, otteniamo la soluzione Schermata 2014-03-08 alle 12.05.28 traduzione E per β ( n , m) nessuna soluzione definitiva, ma ad esempio la banale β ( n , m) = φ ( n ) ( assumendo γ ( n ) = 1 o 0 ). Qui C2 deve essere scelto in modo da rendere γ ( n ) sempre 1 o 0, e il valore necessario per questo scopo dipende dai fatti del sistema primario e non può essere dedotto semplicemente dalle leggi. Deve infatti essere uno o zero: ( a) Se vi è almeno un n positivo o zero n per cui χ ( n ) ≠ 0, secondo che χ ( n) per questo n è -1 o + 1. ( b ) Se vi è almeno un n negativo per cui χ ( n ) ≠ 0 , secondo che χ (n) per questo n è + 1 o -1 . ( c ) Se per nessun n  χ ( n ) ≠ 0 non importa se C2 è  + 1 o -1 . Abbiamo così una definizione disgiuntiva di C2 e così di γ ( n) . Anche in questo caso anche se qualsiasi valore di C1 soddisferà le limitazioni del valore di α ( n ) , probabilmente solo uno di questi soddisferà gli assiomi, e questo valore dovrà nuovamente essere definito disgiuntamente. In terzo luogo, β ( n , m ) non è affatto fissato dalle equazioni, e sarà una questione complessa in cui dovremo nuovamente distinguere alcuni casi, come dire quale delle tante soluzioni possibili di β ( n , m ) soddisferà gli assiomi. Si conclude quindi che non vi è né in questo caso né in generale alcun modo semplice di invertire il dizionario in modo da ottenere sia un’unica o una soluzione ovviamente superiore che soddisferà anche gli assiomi, la ragione di questo si trova parzialmente nelle difficoltà di dettaglio nella soluzione delle equazioni, in parte nel fatto che il sistema secondario ha una molteplicità maggiore, ossia più gradi di libertà, rispetto al primario. Nel nostro caso il sistema primario contiene tre funzioni di una variabile, il secondario virtualmente cinque [ β ( n , 1 ) , β ( n , 2 ) , β ( n , 3 ) , α ( n ), γ ( n ) ] ciascuna che assume 2 o 3 valori, e un tale incremento di molteplicità è, credo, una caratteristica universale delle teorie utili. Poiché, dunque, il solo dizionario non è sufficiente, il prossimo promettente metodo è quello di utilizzare sia il dizionario e gli assiomi in un modo che viene definito in molte ordinarie discussioni delle teorie quando si dice che il significato di una proposizione sul mondo esterno è quello che dovremmo normalmente considerare come criterio o esame della sua verità Ciò suggerisce che dovremmo definire le proposizioni del sistema secondario dai criteri nel sistema primario . Nel seguire questo metodo dobbiamo prima distinguere il criterio sufficiente di una proposizione dal suo criterio necessario. Se p è una proposizione del sistema secondario, noi intendiamo per suo criterio sufficiente, σ ( p ) , la disgiunzione di tutte le proposizioni q del sistema primario in modo tale che p è una conseguenza logica di q insieme con il dizionario e gli assiomi, e tale che ~ q non è una conseguenza del dizionario e assiomi. 1 D’altra parte, dal criterio necessario di p, τ ( p ) noi intendiamo la congiunzione di tutte quelle proposizioni del sistema primario che seguono da p assieme al dizionario e agli assiomi. 1 Le leggi e le conseguenze non hanno bisogno di essere aggiunte, in quanto esse derivano dal dizionario e dagli assiomi. Si potrebbe pensare, tuttavia, che dovremmo prenderle invece degli assiomi, ma è facile vedere che questo aumenterebbe solo la divergenza tra criteri sufficienti e necessari e in generale le difficoltà del metodo. L’ ultima clausola potrebbe essere posta come che ~ q non deve seguire da o essere una legge o conseguenza. Possiamo chiarire il collegamento di σ ( p ) e τ ( p ) come segue. Considerate tutte le possibilità di verità delle proposizioni atomiche nel sistema primario che sono compatibili con il dizionario e gli assiomi. Indichiamo tale verità possibile con r, il dizionario e gli assiomi con a. Quindi σ ( p ) è la disgiunzione di ogni r tale che Schermata 2014-03-08 alle 12.19.06 traduzione Se indichiamo con L la totalità delle leggi e delle conseguenze, cioè la disgiunzione di ogni r qui in questione, allora abbiamo evidentemente Schermata 2014-03-08 alle 12.21.18 Schermata 2014-03-08 alle 13.37.26 Abbiamo anche Schermata 2014-03-08 alle 13.37.37 perché p1 . p2 segue da q quando e solo quando p1 e p2 entrambe seguono. Donde, o allo stesso modo, si ottiene la coppia Schermata 2014-03-08 alle 13.37.45 Abbiamo anche Schermata 2014-03-08 alle 13.37.53 (Si consideri l’r di cui sopra.) Schermata 2014-03-08 alle 13.37.59 traduzione e da ( vi) , ( ii ) , ( iii ). Schermata 2014-03-08 alle 13.38.07 Infine abbiamo Schermata 2014-03-08 alle 13.38.14 Poiché se q deriva o da p1 o da p2 questo segue da p1 v p2 , e la coppia Schermata 2014-03-08 alle 13.38.21 D’altra parte, e questo è un punto molto importante, gli opposti di (vi) – ( xi )non sono in generale veri. Illustriamo questo prendendo ( x ) e considerando questa ‘ r’ : Schermata 2014-03-08 alle 13.38.27 Schermata 2014-03-08 alle 13.52.47 vale a dire che gli occhi dell’uomo sono aperti solo una volta quando vede blu. Da questo possiamo dedurre α ( 0 , 2 ) v α ( 0 , 3) Schermata 2014-03-08 alle 13.52.54 traduzione Ma non possiamo dedurlo da α ( 0 , 2 ) o α ( 0 , 3 ), poiché è ugualmente compatibile con entrambi. Quindi né σ { α ( 0 , 2 ) } né σ { α ( 0 , 3) } è vero. Quindi non abbiamo Schermata 2014-03-08 alle 13.53.01 Ne consegue che non possiamo dare definizioni come questa, se p è un qualsiasi proposizione del sistema secondario, p in virtù delle definizioni rappresenterà σ ( p ) [ o, in alternativa τ ( p ) ], perché se p1 è definito per significare σ ( p1 ), p2  per significare σ ( p2 ) , p1 v p2 significherà σ (p1) v σ (p2), che non è, in generale, lo stesso di σ (p1 v p2 ). Possiamo quindi usare σ solo per definire alcune delle proposizioni dei sistemi secondari, che potremmo chiamare proposizioni secondarie atomiche, da cui seguirebbero i significati delle altre. Ad esempio, prendendo le nostre funzioni α , β , γ potremmo procedere come segue : γ ( n ) è definito come A ( n ) v B ( n ), dove non ci sono difficoltà per A ( n ) v B ( n ) ≣ σ { γ ( n ) } ≣ τ {γ ( n ) } . β ( n , m) potrebbe essere definita che rappresenti σ { β ( n, m ) }, cioè dovremmo dire che il luogo di m era ‘ blu’ all’istante n, solo se ci fosse la prova che lo era. Altrimenti dovremmo dire che non era ‘blu’ ( ‘rosso’ nel linguaggio comune ). Schermata 2014-03-08 alle 13.53.09 traduzione In questo caso diremmo che m era ‘ blu’ ogni volta che non vi era alcuna prova che non lo fosse; questo potrebbe, però, essere stato ottenuto per mezzo di σ se avessimo definito che β ( n , m ) fosse ~ β’ ( n , m ) , e β ‘ ( n , m ) che fosse σ { β ‘ ( n , m ) } , cioè σ applicato a Schermata 2014-03-08 alle 14.34.25 invece che a β . In generale, è chiaro che τ dà sempre quello che potrebbe essere ottenuto applicando σ all’opposto, e possiamo limitare la nostra attenzione a σ. Ciò determina, però, una effettiva differenza se definiamo β o Schermata 2014-03-08 alle 14.34.25 mediante σ, soprattutto in relazione alla posizione 3. Perché non abbiamo alcuna legge per i valori di β ( n , 3 ), né alcun modo di dedurne una tranne quando α ( n , 3) è vero e A ( n) o B ( n ) è vera. Se definiamo β ( n , 3) essere σ { β ( n , 3 ) } , diremo che 3 non è mai blu tranne quando osserviamo che lo sia; se definiamo Schermata 2014-03-08 alle 14.34.25( n , 3) essere      σ{        ( n , 3) } diremo che è sempre blu tranne quando osserviamo che non lo è. Venendo ora ad α ( n , m ) potremmo definire Schermata 2014-03-08 alle 14.38.58 e noi dovremmo per ogni n avere una e una sola α ( n , 1 ) , α ( n , 2 ) , α ( n , 3) vera: mentre se mettiamo semplicemente α ( n , m) = σ { α ( n , m ) } , questo non seguirebbe, poiché σ { α ( n , 1 ) } , { σ (α( n , 2 ) } , { σ ( α (n , 3 ) } potrebbero benissimo essere tutti falsi. Schermata 2014-03-08 alle 14.39.14 traduzione Naturalmente in tutte queste definizioni dobbiamo supporre σ { α ( n , m ) } ecc., sostituito da ciò che nel calcolo troviamo che sia. Così come sono le definizioni sembrano circolari, ma non lo sono se interpretato in questo modo. Per esempio σ { α ( n , 1 ) } è L , cioè le leggi ( 1 ) – ( 5) insieme con Schermata 2014-03-08 alle 14.43.55 Tali allora sembrano essere le definizioni a cui siamo portati dalla frase comune che il significato di una affermazione nel secondo sistema è dato dalla sua regola nel primo. E’ quello di cui abbiamo bisogno? Quello che vogliamo è che, con l’uso di queste definizioni, gli assiomi e il dizionario dovrebbero essere veri quando la teoria è applicabile, vale a dire ogni volta che le leggi e le conseguenze sono veri; cioè che interpretati per mezzo di queste definizioni, gli assiomi e il dizionario deriverebbero dalle leggi e dalle conseguenze. E ‘ facile vedere che essi non derivano in questo modo. Prendete per esempio l’ultimo assioma a pag. 216: Schermata 2014-03-08 alle 14.44.09 che significa che in base alle nostre definizioni Schermata 2014-03-08 alle 14.44.15 che è manifestamente falso, perché se, come è perfettamente possibile, l’uomo non ha mai aperto gli occhi nella posizione 2, sia σ { β ( n , 2) } sia { β σ ( n + 1 , 2) } saranno false. [La definizione con τ non è migliore, poiché τ { β ( n , 2) } e τ ( β ( n + 1 , 2) ) sarebbero entrambe vere.] Questa linea di ragionamento è tuttavia esposta ad un’obiezione delle seguenti specie : Se adottiamo queste definizioni è vero che gli assiomi non deriveranno dalle leggi e dalle conseguenze, ma in realtà non è necessario che lo debbano. Perché le leggi e le conseguenze non possono rappresentare l’intera empirica (cioè il sistema primario ) base della teoria. È, per esempio, compatibile con le leggi e con le conseguenze che l’ uomo non avrebbe mai aver avuto gli occhi aperti nella posizione 2; ma come avrebbe allora potuto mai formulare questa teoria con la legge peculiare dell’alternanza che egli attribuisce alla posizione 2? Quello che vogliamo per costruire la nostra teoria per mezzo di definizioni esplicite, non è che gli assiomi deriverebbero solo dalle leggi e dalle conseguenze, ma da queste insieme con alcune proposizioni esistenziali del sistema primario che rappresentano le esperienze che l’uomo deve aver avuto per essere in grado con una qualche dimostrazione della ragione di formulare la teoria. Sebbene questa obiezione è ragionevole nel caso presente, questo può essere osservato prendendo una teoria leggermente più complicata per non procacciarci nessuna soluzione generale della difficoltà; vale a dire, tali proposizioni come possono in questo modo essere aggiunte alle leggi e alle conseguenze non fornirebbero sempre una base sufficiente per gli assiomi. Per esempio, si supponga che la teoria prevedesse un intero sistema di luoghi identificati dalle sequenze di movimento necessarie per passare dall’uno all’altro, e si trovasse e fosse incorporata nella teoria che il colore di ciascun luogo seguisse un complicato ciclo, lo stesso per ogni luogo, ma che i luoghi differiscono l’uno dall’altro per la fase di questo ciclo secondo nessuna legge accertabile. Chiaramente una tale teoria potrebbe essere ragionevolmente formata da un uomo che non avesse avuto gli occhi aperti in ciascun luogo, e non aveva motivi per pensare che egli dovesse mai aprire gli occhi in tutti i luoghi oppure che li dovesse visitare completamente. Supponiamo allora che m sia un luogo dove non è stato mai, e che β ( n , m ) sia una funzione del secondo sistema, con il significato che che m è blu in n; quindi a meno che non conosca la fase di m, non possiamo mai avere σ { β ( n , m ) }, ma se ad esempio il ciclo dà un colore blu una volta su sei, dobbiamo avere da un assioma β (0 , m ) v β (1, m) v . . . v β ( 6 , m ). Abbiamo, quindi, solo la stessa difficoltà di prima . Se, dunque, la nostra teoria deve essere costruita da definizioni esplicite, queste non possono essere semplici definizioni mediante σ ( o τ ) , ma devono essere più complicate. Per esempio , per quanto riguarda la posizione 2 nel nostro esempio originale possiamo definire Schermata 2014-03-08 alle 16.21.57 traduzione Cioè se non sappiamo quale fase sia, si suppone che sia una certa fase, comprendendo questa ‘ assunzione ‘ nella nostra definizione. Ad esempio assumendo che la fase sia blu pari, rosso dispari, intendiamo che abbiamo motivo di pensare che sia questa; assumendo che la fase sia blu dispari, rosso pari, noi intendiamo che non abbiamo motivo di pensare che lo sia, ma solo che non abbiamo motivo di pensare il contrario. Ma in generale le definizioni dovranno essere molto complicate; dovremo, al fine di verificare che siano complete, passare attraverso tutti i casi che soddisfano le leggi e le conseguenze (insieme con qualsiasi proposizioni del sistema primario pensiamo corretto assumere) e verificare che in ogni caso le definizioni soddisfino gli assiomi, in modo che alla fine arriveremo a qualcosa di molto simile alle definizioni disgiuntive generali con cui abbiamo iniziato questa discussione (p. 220). Nella migliore delle ipotesi avremo disgiunzioni con un minor numero di termini e una maggiore coerenza e unità nella loro costruzione; quanto dipenderà dal caso particolare. Abbiamo potuto vedere immediatamente che (in un sistema finito) tali definizioni sono sempre possibili, e per mezzo di τ σ e non abbiamo raggiunto nessuna reale semplificazione. 3. Abbiamo visto che possiamo sempre riprodurre la struttura della nostra teoria per mezzo di definizioni esplicite. La prossima domanda è ‘ questo è necessario per l’uso corretto della teoria? ‘ La risposta a questo sembra evidente che non può essere necessario, o una teoria sarebbe del tutto inutile. Invece di dare tutte queste definizioni sarebbe più semplice lasciare i fatti, le leggi e le conseguenze nella lingua del sistema primario. Anche l’arbitrarietà delle definizioni rende impossibile per esse di essere adeguate alla teoria come qualcosa in processo di crescita. Per esempio, la nostra teoria non dà alcuna legge per il colore del luogo 3; dovremmo, quindi, nel costituire la nostra teoria in definizione esplicita, definire il luogo 3 di essere rosso a meno che fosse osservato essere blu (o viceversa). Una ulteriore osservazione potrebbe ora portarci ad aggiungere alla nostra teoria un nuovo assioma circa il colore del luogo 3 fornendo, per dire, un ciclo che esso segue; questo apparirebbe semplicemente come un’aggiunta agli assiomi, essendo gli altri assiomi e il dizionario inalterati. Ma se la nostra teoria era stata costruita con definizioni esplicite, il nuovo assioma non sarebbe vero se non avessimo cambiato le definizioni, perché dipenderebbe da una ben diversa assegnazione dei colori al luogo 3 nel tempo, quando era stato inosservata dal nostro vecchio assioma (che lo poneva sempre rosso in quegli istanti), o addirittura da qualsiasi vecchio assioma, salvo quello prescritto esattamente dal nostro nuovo assioma, che non avremmo mai trovato per utilizzarlo nelle nostre definizioni a meno che non avessimo conosciuto già il nuovo assioma. Vale a dire, se si procede per definizione esplicita non possiamo aggiungere alla nostra teoria senza modificare le definizioni, e quindi il senso dell’insieme. [ Ma sebbene l’uso di definizioni esplicite non può essere necessario, è, penso, istruttivo il considerare (come abbiamo fatto ) come tali definizioni potrebbero essere costruite, e da quali possibilità dipenda di renderle semplici. Anzi penso che questo sia fondamentale per una comprensione completa del soggetto.] 4 . Assumendo allora che le definizioni esplicite non siano necessarie, come possiamo spiegare il funzionamento della nostra teoria senza di esse?   Chiaramente in tale teoria è coinvolto un giudizio, e i giudizi in questione potrebbero essere dati dalle leggi e dalle conseguenze, essendo la teoria semplicemente un linguaggio di cui sono vestiti, e che possiamo usare senza elaborare le leggi e le conseguenze. Il modo migliore per scrivere la nostra teoria sembra essere questo ( ∃ α , β , γ ) : dizionario.assiomi. Essendo il dizionario in forma di equivalenze. Qui è evidente che α , β , γ vengono presi puramente estensionalmente. Le loro estensioni possono essere riempite con intensioni o meno, ma questo è irrilevante per quanto dedotto nel sistema primario. Qualsiasi integrazioni alla teoria, sia sotto forma di nuovi assiomi o di particolari affermazioni come α ( 0 , 3 ), devono essere effettuate nell’ambito degli originali α, β , γ . Esse non sono, quindi, strettamente proposizioni da sole proprio come le diverse frasi in una storia che inizia con ‘ C’era una volta ‘ non hanno significati completi e quindi non sono proposizioni esse stesse. Questo rende insieme una differenza teoretica e pratica : ( a) Quando cerchiamo il significato di esempio di α ( 0 , 3) può essere fornito solo quando sappiamo a quale insieme di ‘proposizioni’ del primo e del secondo sistema α ( 0 3 ) deve essere aggiunto. Quindi il significato è la differenza tra il primo sistema tra ( ∃ α , β , γ ) : insieme . α ( 0 , 3 ) , e ( ∃ α , β , γ ) . insieme. (Includiamo proposizioni del sistema primario nel nostro insieme, anche se queste non contengono α , β , γ.) Questa considerazione rende α ( 0 , 3) che significa qualcosa di simile a quello che abbiamo chiamato prima τ { α ( 0 , 3 ) } , ma in realtà è la differenza tra τ { α ( 0 , 3) + insieme } e τ ( insieme). ( b) In pratica, se ci poniamo la domanda: ” È α ( 0 , 3) vero? “, Dobbiamo adottare un atteggiamento piuttosto diverso da quello che dovremmo adottare per una vera e propria proposizione. Perché noi non aggiungiamo α ( 0 , 3) al nostro insieme ogni volta che pensiamo che potremmo in verità farlo, cioè ogni volta che supponiamo ( ∃ α , β , γ ) : insieme. α ( 0 , 3) essere vero. ( ∃ α , β , γ ) : insieme .  Schermata 2014-03-08 alle 16.52.18potrebbe anche essere vero . Dobbiamo pensare a cos’altro potremmo aggiungere al nostro insieme, o sperare di aggiungere, e valutare se α ( 0 , 3) soddisferebbe eventuali ulteriori integrazioni meglio di  Schermata 2014-03-08 alle 16.52.18. Ad esempio nella nostra piccola teoria o, β ( n , 3 ) o  potrebbero sempre essere aggiunti a qualsiasi insieme che comprende Schermata 2014-03-08 alle 16.52.40 Ma noi non aggiungiamo né l’uno né l’altro, perché speriamo dai casi osservati di trovare una legge e poi di soddisfare quelli non osservati in base a tale legge, non a casualmente anticipatamente. Finora, tuttavia, per quanto concerne il ragionamento, che i valori di queste funzioni non sono proposizioni complete non fa differenza, purché interpretiamo tutte le combinazione logiche come operanti nell’ambito di un singolo prefisso ( ∃ α , β , γ ) , ad esempio Schermata 2014-03-08 alle 16.52.53 traduzione Perché noi possiamo ragionare su i personaggi di una storia altrettanto bene come se fossero identificati nella realtà, purché non prendiamo parte di quello che diciamo da una storia, parte da un’altra. Possiamo dire, quindi, che l’incompletezza delle ‘proposizioni’ del sistema secondario influisce sulle nostre controversie, ma non sul nostro ragionare. 5 . Questa menzione sulle ‘controversie’ ci conduce alla importante questione dei rapporti tra teorie. Che cosa si intende parlando di teorie equivalenti o contraddittorie? o dire che una teoria è contenuta in un’altra, ecc. ? In una teoria dobbiamo distinguere due elementi: ( 1) Che cosa afferma : il suo significato o il suo contenuto . ( 2 ) La sua forma simbolica . Due teorie sono definite equivalenti se hanno lo stesso contenuto, contraddittorie se hanno contenuti contraddittori, compatibili se i loro contenuti sono compatibili, e la teoria A è detta contenuta nella teoria B se il contenuto di A è contenuto nella materia trattata da B. Se due teorie sono equivalenti, ci possono essere maggiori o minori somiglianza tra le loro forme simboliche. Questo tipo di somiglianza è difficile se non impossibile da definire con precisione. Si potrebbe pensare possibile definire un determinato grado di somiglianza mediante la possibilità di definire le funzioni di B in termini di quelle di A, o viceversa; ma questo non ha alcun valore senza alcuna restrizione sulla complessità delle definizioni. Se permettiamo definizioni con qualsiasi grado di complessità, allora, almeno nel caso finito, questa relazione diventa semplicemente una equivalenza. Perché ogni insieme di funzioni può essere definita nei termini del sistema primario e quindi di quelle dell’altro sistema secondario attraverso il dizionario. Due teorie possono essere compatibili senza essere equivalenti, cioè un insieme di fatti potrebbe scoprirsi che concorda con entrambe, e un’altro insieme che anche concorda con uno ma non con un altro. I seguaci di tali due teorie potrebbero benissimo disputare, sebbene né l’uno né l’altro affermino qualcosa che l’altro nega. Per una disputa non è necessario che un contendente affermi p, l’altro Schermata 2013-11-24 alle 21.04.13.  E’ sufficiente che uno affermi qualcosa che l’altro si astiene dall’asserire. Ad esempio uno dice ‘ Se piove, Cambridge vincerà ‘ , l’ altro dice ‘ Anche se piove, perderà ‘. Ora, assunte come implicazioni materiali (come dobbiamo da questo punto di vista scientifico), queste non sono incompatibili, perché se non piove entrambe sono vere. Eppure ognuno può mostrare motivi per la propria convinzione e la mancanza di motivazione per il suo rivale. La gente a volte si domanda se una ‘ proposizione ‘ del sistema secondario ha qualche significato. Possiamo interpretare questo come la domanda se una teoria in cui questa proposizione è stata negata sarebbe equivalente a quello in cui essa fosse affermata. Ciò dipende naturalmente da che altro si ritiene che la teoria debba contenere; per esempio, nel nostro esempio β ( n , 3 ) è senza senso accoppiata con Schermata 2014-03-08 alle 18.04.29Ma non accoppiata così non è priva di significato, in quanto allora escluderebbe il mio vedere rosso in certe circostanze, mentre Schermata 2014-03-08 alle 16.52.31 escluderebbe il mio vedere blu in queste circostanze. E‘ possibile che tali circostanze si avverino, e quindi che le teorie non siano equivalenti. Nel linguaggio del realismo diciamo che si potrebbe osservare, o meglio, dovrebbe essere osservato (poiché ‘potrebbe ‘ implica una dipendenza dalla nostra volontà, che è spesso il caso, ma irrilevante), ma non che sarà osservato. Anche accoppiato con Schermata 2014-03-08 alle 18.04.29, β ( n , 3) potrebbe ricevere un significato più avanti se abbiamo aggiunto alla nostra teoria qualche legge circa il colore del 3. [ Anche se poi di nuovo β ( n , 3) sarebbe probabilmente una conseguenza o una contraddizione con il resto: dovremmo allora, penso, dire che deve avere un significato in quanto ad esempio β ( n , 3) darebbe una teoria, Schermata 2014-03-08 alle 16.52.31 una contraddizione.] E ‘ molto rilevante per questa domanda se le proposizioni abbiano un significato, non soltanto quali assiomi generali includiamo nella nostra teoria, ma anche quali proposizioni particolari. Ha significato dire che la parte posteriore della luna ha una superficie di formaggio verde? Se la nostra teoria ammette la possibilità che potremmo andare là o scoprirlo in qualsiasi altro modo, allora ha un senso. Se no, no; cioè la nostra teoria della luna è molto importante, non solo la nostra teoria degli oggetti in generale. 6 . Potremmo chiederci: in che tipo di teorie ogni ‘ proposizione ‘ del sistema secondario ha significato in questo senso? Non posso rispondere a questa domanda con proprietà, ma solo molto vagamente e in modo incerto, né credo che sia molto importante. Se la teoria è il corrispondere ad un effettivo stato di conoscenza deve contenere le traduzioni tramite il dizionario di molte proposizioni particolari del sistema primario. Queste, quasi certamente, impediranno a molte ‘ proposizioni ‘ del sistema secondario di avere un significato diretto. Ad esempio se si afferma nella teoria che all’istante n io sono nel luogo 1, allora per il luogo 2 di essere blu in quell’istante n potrebbe non avere alcun significato diretto, né per qualunque luogo molto distante all’istante n + 1. Se allora tali ‘proposizioni’ sono tali da avere del tutto significato, deve essere o perché esse o le loro contraddittorie sono incluse nella teoria stessa ( esse allora significano ‘ niente’ o ‘ contraddizione ‘) o in virtù di assiomi causali che le collegano con altri eventuali fatti primari, dove ‘ possibile ‘ significa non dichiarati nella teoria essere falsi. Questo causalità è, ovviamente, nel secondo sistema, e deve essere prevista nella teoria. Oltre agli assiomi causali in senso stretto che governano la successione temporale, ce ne potrebbero essere altri che governano la disposizione nello spazio che richiedono, per esempio, la continuità e la semplicità. Ma questi possono essere stabiliti soltanto se siamo sicuri che non entreranno in conflitto con l’esperienza futura combinata con gli assiomi causali. In un settore in cui la nostra teoria garantisce questo possiamo aggiungere tali assiomi di continuità. L’assegnare alla natura la direzione più semplice, tranne quando l’esperienza dimostra il contrario è un buon precetto nel costruire una teoria, ma non può essere messo nella teoria nella forma ‘ Natura non facit saltum ‘ tranne quando vediamo  che la natura fa così. Prendete, per esempio, il problema “Esiste un pianeta delle dimensioni e della forma di una teiera? ” Questa domanda ha un senso fino a quando non sappiamo che un esperimento potrebbe definire la questione. Una volta che lo sappiamo questo perde significato, a meno che non lo ripristiniamo con nuovi assiomi, ad esempio, un assioma per le orbite possibili a questi pianeti. Ma qualcuno dirà : “Non è una domanda chiara con onus probandi per la definizione da qualche parte? ” Chiaramente significa ” l’esperienza ci rivelerà un tale tipo di teiera? ” Non credo, perché ci sono tre casi : ( 1) L’esperienza evidenzierà che esiste una tale teiera. ( 2) L’esperienza mostrerà che non esiste una tale teiera. ( 3) L’esperienza non mostrerà nulla . E possiamo distinguere abbastanza bene ( 2) da ( 3) anche se chi fa l’obiezione li confonde. Questa teiera non è in linea di principio diversa da una teiera nella credenza della cucina.

Frank Ramsey: FURTHER CONSIDERATIONS – Capitolo VIII di The Foundation of Mathematics e Parte C. di Last Papers

22 Giu

Ramsey_2Propongo la mia traduzione delle parti del testo di Frank Plumpton Ramsey aggiuntive all’esame dei sistemi di valutazione delle probabilità. Si tratta del capitolo VIII di The Foundation of Mathematics e la sezione C. del capitolo IX ‘Last Papers’.

Si tratta di una serie di elementi aggiuntivi e correttivi della teoria esposta nel capitlo VII.

VIII

ULTERIORI CONSIDERAZIONI (1928)

A. RAGIONEVOLE GRADO DI CONVINZIONE

Quando passiamo oltre ragionevole = mio, o = scientifico, il definirlo in modo esatto è proprio impossibile. Seguendo Peirce, lo affermiamo per un’abitudine non per un giudizio individuale. Approssimativamente, un ragionevole grado di convinzione = proporzione di casi in cui questa abitudine porta alla verità. Ma nel cercare di essere più precisi si incontrano le seguenti difficoltà:

(1) Non si può sempre prendere l’abitudine presente: potrebbe in modo corretto essere derivata da una qualche precedente esperienza accidentalmente fuorviante. Allora guardiamo ad una più larga abitudine a formare una tale abitudine.

(2) Non possiamo fornire una percentuale di casi reali; ad esempio in un gioco di carte a cui si gioca molto raramente, così che delle particolari combinazione in questione ci sono pochissimi casi effettivi.

(3) A volte effettivamente accettiamo una teoria del mondo con alcune leggi e alcune possibilità, e intendiamo non la percentuale dei casi effettivi ma quale è la probabilità della nostra teoria.

(4) Ma si potrebbe sostenere che questa complicazione non sarebbe necessaria a causa della (1) per la quale noi prendiamo in considerazione solo le abitudini molto generali, delle quali ci così sono tanti esempi che, se la probabilità secondo la nostra teoria differisse dalla percentuale effettiva, la nostra teoria dovrebbe essere sbagliata.

(5) Anche in un caso basilare come l’induzione, potrebbe non esserci alcuna possibilità per esso: questo non è il caso di cose riguardanti una probabilità.

Fortunatamente non vi è alcun motivo per fissare in un preciso il senso di ‘ragionevole’; questo potrebbe essere imposto solo per uno o due motivi: o perché il ragionevole sarebbe il soggetto argomento di una scienza (che non è il caso); o perché ci aiuterebbe ad essere razionali per conoscere cosa è una ragionevolezza (che non ci aiuta, sebbene alcune false opinioni potrebbero impedircelo). Per rendere chiaro che non è necessario per ambedue questi scopi si deve considerare (1) il contenuto della logica

e (2) l’utilità della logica.

IL CONTENUTO DELLA LOGICA

(1) Preliminare all’indagine filosofico-psicologica sulla natura del pensiero, sulla verità e ragionevolezza.

(2) Formule per la deduzione formale = matematica.

(3) Indicazioni per evitare confusione (appartiene alla psicologia medica).

(4) Schema della maggior parte delle proposizioni generali conosciute o utilizzate come abitudini di inferenza da un punto di vista astratto; o rozzamente induttivo, come ‘il metodo matematico ha risolto tutti questi altri problemi, quindi … ‘, oppure sistematica, quando viene chiamato metafisica. Tutto questo potrebbe ad ogni modo essere chiamato metafisica; ma è considerato come la logica, quando addotto come avente relazione con un problema irrisolto, non semplicemente come informazione interessante per personale interesse.

L’unica di queste che è una scienza distinta è evidentemente la (2).

L’UTILITÀ DELLA LOGICA

Quella delle sopra indicate (1) (3) sono evidenti: quelli interessanti sono le (2) e (4). (2) = la matematica è indispensabile per manipolare e sistematizzare le nostre conoscenze. Oltre a questo (2) e (4) ci aiutano a in qualche modo a pervenire a delle conclusioni nel giudizio.

 LOGICA COME AUTOCONTROLLO (cfr. Peirce)

L’autocontrollo, in generale, significa o

(1) non agire in base al desiderio temporaneamente dominante, ma fermarsi a riflettere bene su questo; cioè porre attenzione a tutti i desideri e verificare quale è effettivamente il più forte; nella valutazione di questo consiste l’eliminazione delle incoerenze nell’agire;

o (2) disporre come risultato di una abitudine decisionale abitudini ad agire in risposta non a desideri o stimoli occasionali, ma in un modo deciso adeguato ad un desiderio stabile.

La differenza è che in (1) ci fermiamo a pensarci bene ma in (2) ci abbiamo pensato bene prima e ci fermiamo solo a fare ciò che avevano precedentemente deciso di fare.

Così anche la logica ci permette di

  1. Non formulare un giudizio sulla base delle prove immediatamente davanti a noi, ma a fermarci a pensare a tutto il resto che noi riteniamo in qualche modo pertinente. Ci permette di non essere incoerenti, e anche di porre attenzione alle questioni veramente generali, ad esempio, tutti i corvi che ho visto sono di colore nero, così questo sarà – non un corvo; il colore è in determinate altre specie di uccelli una qualità variabile.. Così, ad esempio non solo argomentare da φa, φb …a (x).φ(x) come probabile, ma il considerare che il sostenere che a, b. . . siano la classe che ho visto (e quelle visibili sono in modo particolare probabilmente o improbabilmente φ). Questa differenza tra selezione influenzata e casuale. 1

1 Vedi infra ‘Chance’.

(2) Il formare certe abitudini fisse di procedura o di interpretazione solo riviste ad intervalli quando pensiamo bene sugli oggetti. In questo è lo stesso di qualsiasi giudizio generale; dobbiamo solo considerare il processo come ‘logico’ quando è molto generale, non ad esempio aspettarsi che una donna sia infedele, ma ad esempio di respingere coefficienti di correlazione con un errore probabile più grande di loro.

Per quanto riguarda la formazione di un giudizio o una giudizio parziale (che è una decisione che corrisponde ad un grado di convinzione di un certo grado, cioè ad agire in un certo modo), si deve notare che: –

(a) Quello che domandiamo è ‘p?’ non ‘Sarebbe giusto pensare p? ‘Né ‘ Sarebbe ragionevole pensare p? ‘ (Ma questi potrebbero essere utili primi passi.)

ma (b) ‘Sarebbe vero pensare p?’ non può mai essere determinata senza determinare a cosa corrisponda p.

(c) ‘Sarebbe ragionevole pensare p?’ significa semplicemente ‘ è p quanto accade di solito in un caso del genere?’ ed è vago come ‘solito’. Porre questa domanda ci potrebbe aiutare, ma spesso non sembra più facile rispondere che p stessa.

(d) non può neppure essere fissato il preciso significato in cui ‘ragionevole’ o ‘solito’ può essere utilmente adottato, né assegnato un peso per qualche principio a diverse considerazioni di tal sorta. Ad esempio il tasso di mortalità per gli uomini di 60 anni è di 1/10, ma tutti i 20 sessantenni dai capelli rossi che ho conosciuto hanno vissuto fino a 70 anni. Cosa mi dovrei attendere dei nuovi sessantenni dai capelli rossi? Non posso che mettere le prove davanti a me, e lasciare che agiscano nella mia mente. Vi è un conflitto di due ‘di solito’, che deve venir elaborato nella mia mente; uno non è realmente ragionevole, l’altro è effettivamente ragionevole.

(e) Tuttavia, quando la prova è molto complicata, le statistiche vengono introdotte per semplificarla. Queste devono essere scelte in modo tale da influenzare me quanto più possibile nello stesso modo come farebbe l’insieme dei fatti che essi rappresentano se riuscissi a comprenderli con chiarezza. Ma questo non può essere del tutto ridotto a una formula; il resto della mia conoscenza può influenzare la questione; quindi p può essere equivalente in influenza a q, ma non ph a qh.

(f) Ci sono casi eccezionali in cui ‘Sarebbe ragionevole pensare p’ risolve completamente l’argomento. Così, se ci viene detto che uno dei nomi di queste persone inizia con A e che ci sono 8 di queste persone, è ragionevole credere con grado un ottavo che il nome di qualche particolare nome inizia con A, e questo è ciò che dovremmo fare tutti (a meno che non sentissimo che ci sia qualche qualcosa di pertinente).

(g) Tuttavia, introdurre l’idea di ‘ragionevole’ è in realtà un errore; ma sarebbe meglio dire ‘solitamente’, che rende evidente l’indeterminatezza dell’insieme: ciò che è ragionevole dipende da ciò che viene assunto come importante; se assumiamo come abbastanza importante, se è ragionevole pensare p diventa almeno un problema difficile come p. Se prendiamo tutto come importante è la stessa cosa.

(h) Cosa dovremmo prendere come importante? Quel genere di cose che è utile prendere come importanti; se mettessimo in relazione con l’essere importante con riferimento a quello che assumiamo come importante, questo potrebbe significare ogni cosa. Altrimenti è impossibile affermarlo; ma il problema è quello posto dall’osservatore non dalla persona stessa che pensa: se il pensatore sente un oggetto importante non può eliminarlo; e se lo sente irrilevante non potrà usarlo.

(i) Solo quindi, se sentiamo in realtà essere molto poco importante, o rispondiamo o possiamo rispondere alla domanda con un riferimento a ciò che è ragionevole, essendo questo quindi equivalente a ciò che noi riconosciamo e consideriamo importante.

(j) Quello che viene o non viene preso come importante sono non solo le proposizioni ma anche gli oggetti formali, ad esempio a=a: noi possiamo reagire diversamente a φa che a qualsiasi φx non per qualcosa che sappiamo circa a ma ad esempio per ragioni emotive.

 B. STATISTICHE

La scienza statistica si occupa di sintesi di fatti circa numerosi individui che vengono interpretati come una selezione casuale da una ‘popolazione’ infinita. Se le qualità in questione sono discrete, questo significa semplicemente che si considerano le percentuali degli individui osservati che hanno certe qualità, e attribuire queste percentuali alla ipotetica popolazione. Se le qualità sono continue, assumiamo che la popolazione sia di una opportuna forma semplice contenente vari parametri che vengono poi scelti per dare la massima probabilità agli esempi oggetto di osservazione. In entrambi i casi l’errore probabile viene calcolato per un certo campione estratto da una certa popolazione. (Per tutto questo si veda Fisher).1

Il significato di questa procedura è che registriamo in una semplice conveniente forma

(1) Le percentuali approssimative aventi le caratteristiche date in gradi diversi,

(2) Il numero di esempi che abbiamo osservato (il peso della nostra induzione) (errore probabile).

Per l’utilizzo dei numeri per dare un grado di convinzione per quanto riguarda un nuovo esempio non può essere data nessuna regola.

L’introduzione di una popolazione infinita è una invenzione stupida, che non può essere difesa se non attraverso qualche riferimento a procedure ad un limite, che ne distrugge il significato. La procedura di calcolare i parametri per massima verosimiglianza e probabile errore può essere definito come un processo di matematica pura; il suo significato è nel suggerire una teoria o un insieme  di probabilità. La percentuale di una popolazione infinita dovrebbe essere sostituita dalla probabilità.

Ovviamente lo scopo non è sempre la semplice induzione ma l’analisi causale: troviamo che le probabilità non sono quello che ci aspettiamo, quindi o il dado è truccato o adesso le persone sono più accurate, ecc.

1 “Teoria della stima statistica,” [p.204] RA Fisher, Proc. Camb. Phil. Soc., 22, pp.700-725 (1925), and Statistical Methods for Research Workers.

C. PROBABILITA’

(1) Non esistono cose come probabilità oggettive, nel senso in cui alcune persone immaginano che ci siano, ad esempio, N. Campbell, Nisbet.1

Non esiste, per esempio, nessun dato di fatto nella forma ‘In n consecutivi lanci il numero di teste si trova compreso tra n/2±ε(n)’. Al contrario, abbiamo buoni motivi di ritenere che una legge del genere sarebbe rotta, se prendiamo abbastanza casi di questi lanci.

Né esiste un qualche dato di fatto determinato empiricamente su una serie infinita di lanci; questa formulazione viene adottata solo per evitare una contraddizione con l’esperienza; e ciò che nessuna esperienza può contraddire, nessuna esperienza può confermare, permette solo di non parlare di enunciarlo.

(N. Campbell fa un semplice errore in questo.)

Una teoria grezza della frequenza è inammissibile poiché essa giustifica la ragione della ‘maturità delle probabilità’, ad esempio con riguardo al sesso della prole.

(2) Quindi le probabilità devono essere definite attraverso i gradi di convinzione; ma essi non corrispondono a nessuno effettivo grado di convinzione; le probabilità di 1.000 volte tasta e di 999 seguita da croce, sono uguali, ma tutti si aspetterebbero più le prime rispetto alle seconde.

(3) Le probabilità sono gradi di convinzione all’interno di un determinato sistema di convinzioni e di gradi di convinzione; non quelli di qualsiasi persona reale, ma in un sistema semplificato a cui quelli di persone reali, specialmente di chi parla, in parte si approssimano.

(4) Questo sistema di convinzioni è costituito, in primo luogo, delle leggi naturali, che sono in questo date per certe, sebbene, naturalmente, le persone non siano in realtà abbastanza sicure di queste.

(5) Oltre a ciò il sistema contiene vari oggetti di questo genere: quando conoscendo ψx e null’altro di importante, si aspetta sempre φx con grado di convinzione p (ciò che è o non è importante è anche specificato nel sistema); che si può anche scrivere che la probabilità di φ dato ψ è p(se p = 1 è lo stessa cosa di una legge). Queste probabilità insieme con le leggi formano un sistema deduttivo secondo le regole di probabilità, e le convinzioni effettive di un utilizzatore del sistema dovrebbe approssimarsi a quelle dedotte da una combinazione del sistema e dalla particolare conoscenza di fatto posseduta dall’utente, questo ultimo essendo (inesattamente) assunto come determinato.

1 R.H. Nisbet, “The Foundation of Probability”, Mind, 1926.

(6) Le probabilità di un tale sistema non devono essere confuse con le frequenze; la probabilità di φx dato ψx potrebbero essere anche diverse dalla frequenza conosciuta di ψ che è φ. Ad esempio la probabilità di una moneta  di dare testa ieri è 1/2 dal momento che ‘ieri’ è irrilevante, ma la percentuale che effettivamente ha dato testa ieri potrebbe essere 1.

(7) E’ evidente, tuttavia, che non siamo provveduti di sistemi che forniscano un grado di convinzione in ogni possibile proposizione per qualsiasi base di conoscenza dei fatti. I nostri sistemi coprono solo parte del campo; e dove non abbiamo un sistema diciamo che non conosciamo le probabilità.

(8) I fenomeni che hanno probabilità sistematiche sono giochi d’azzardo, nascite, morti, e tutti i tipi di coefficienti di correlazione

(9) Cosa si intende per probabilità oggettiva non è solo il nostro avere nel nostro sistema una probabilità φ(x)/ψ(x), ma nel nostro non avere speranza di modificare il nostro sistema in un paio di leggi αx.ψx.⊃x .φx:βx.ψx.⊃x . ∼φx, ecc., dove αx, βx sono disgiunzioni di proprietà facilmente osservabili (precedenti nel tempo a φx). Questo si verifica, come puntualizza Poincaré 1, quando piccole cause producono grandi effetti.

Le probabilità sono in un altro senso oggettive, nel senso in cui tutti sono d’accordo su di esse, a differenza ad esempio per le scommesse sui cavalli.

(10) Cosa si intende per un evento di non essere una coincidenza, o non essere dovuto al caso, è che se andiamo a conoscerlo, ci costringerebbe a non considerare più a lungo il nostro sistema come soddisfacente, anche se nel nostro sistema l’evento può essere più improbabile rispetto a qualsiasi alternativa. Così 1.000 volte testa nel lancio di una moneta non sarebbe dovuto al caso; cioè se lo osservassimo dovremmo cambiare il nostro sistema di probabilità per il lancio di quel penny. Se questo viene chiamato h, le probabilità nel nostro sistema con h come ipotesi sono molto diverse dai nostri gradi effettivi di convinzione in determinati h.

Dicendo che un oggetto non è dovuto al caso, noi solamente intendiamo che il nostro sistema di probabilità deve essere modificato, non che questo deve diventare un sistema di leggi. Così per una moneta truccata che da’ testa non è dovuto alla probabilità anche se non sempre funziona così; per esempio: la probabilità può essere posta ad esempio = 2/3, non 1/2 .

Se diciamo ‘Il nostro incontro non era dovuto al caso’, cioè programmato, la programmazione è solo un fattore che modifica le probabilità; ma potrebbe anche essere ad esempio che stavamo camminando nella stessa strada.

(11) Questo è il motivo per cui N. Campbell pensa che coincidenze non si possano ammettere che avvengano; vale a dire le coincidenze . ⊃ . un sistema errato, ∴ un sistema . ⊃ . nessuna coincidenza. A quanto pare formalmente coerente; ma questo è un errore perché il sistema non è una proposizione che è vera o falsa, ma un’imprecisa approssimazione di uno stato d’animo in cui alcune imperfezioni possono in determinate circostanze risultare particolarmente evidenti.

1Vedi Science et Hypothèse e Science et Méthode.

(12) Con gli oggetti che sono in ultima analisi, dovuti al caso, intendiamo dire che non esiste una legge (qui una generalizzazione di una complessità maggiore di quella gestibile), conosciuta o sconosciuta, che determina il futuro a partire dal passato. Se supponiamo inoltre che hanno probabilità assolute, questo rappresenta una sorta di sistema migliore in cui avere queste probabilità.

(13) Nella scelta di un sistema dobbiamo risolvere con un compromesso tra due principi: fatta salva la condizione che il sistema non deve contraddire i fatti che conosciamo, scegliamo (essendo un altro oggetto equivalente) il sistema più semplice, e (a parità di condizioni) scegliamo il sistema che dia la più alta probabilità ai fatti che abbiamo osservato. Questo ultimo è di ‘principio di massima verosimiglianza ‘ di Fisher, e fornisce l’unico metodo di verifica di un sistema di probabilità.

(14) La probabilità in fisica significa possibilità come spiegato qui, con alcune possibili complessità aggiunte perché siamo interessati ad una ‘teoria’ nel senso di Campbell, non solo ad un sistema normale che è una generalizzazione della legge di Campbell.’ Cosa sia il caso in una teoria è difficile da spiegare fino a che non sapremo di più sulla natura delle teorie.1

1 [Vedi la sezione seguente – Ed. ]

(15) La scienza statistica deve essere brevemente trattata dal nostro punto di vista; essa ha tre parti

(a) Raccolta e ordinamento di una selezione di dati da un una moltitudine di dati

(b) induzione = formare un sistema di probabilità dei dati mediante il Principio di Massima Verosimiglianza.

(c) analisi causale: ad esempio, questo dado cade così spesso in questo modo in su, quindi il suo centro di gravità deve essere spostato verso la faccia opposta.

(16) L’unica difficoltà è presente in relazione a (c) analisi causale, in cui ci sembra di fare una asserzione di probabilità come un fatto, e di sostenere ‘il dare così spesso sei non è dovuto al caso’‚ ∴ probabilità > 1/6 ∴ centro di gravità spostato. Ragionamento che sembra incompatibile con la nostra soluzione del paradosso che ‘la probabilità = 1/6’, è incoerente con questa coincidenza che era che ‘la probabilità =1/6’, la probabilità >1/6’ non sarebbero proposizioni e pertanto non potrebbero servire come premesse e conclusioni di ragionamenti.

(17) La difficoltà viene rimossa dall’osservazione che il sistema che in definitiva stiamo utilizzando non solo ci fornisce il grado di convinzione o di probabilità di x di dare sei assumendo che x sia lanciato = 1/6, ma anche una probabilità di x di dare sei dato che x viene lanciato ed è truccato >1/6. Di conseguenza, dal recepimento che x è truccato/ x esce sei volte che x è lanciato > che x è truccato/ x è lanciato. Se a/bh> a/h, allora b/ah>b/h e questo è come dovremmo pensare. La probabilità di a che x lanciato dia sei è p sembra si debba trattare come una vera proposizione, ma quello che realmente intendiamo è una condizione non esplicita, che nel nostro sistema nel momento che viene aggiunto alle ipotesi determina la probabilità p.

(18) Possiamo affermare questo così: l’analisi casuale statistica presuppone un sistema basilare all’interno del quale si muove e che lo lascia immutato; questa non è né sembra possa essere trattata come una proposizione. Ciò che sembra si possa trattare così è un più ristretto sistema derivato o derivabile dal sistema principale con l’aggiunta di una premessa empirica, e ciò che è effettivamente trattato come una proposizione e modificato o respinto non è il sistema più ristretto, ma la premessa empirica su cui essa si basa.

Naturalmente questa premessa empirica può essere sconosciuta o molto vagamente conosciuta; ad esempio, concludo dal fatto che sono nati più ragazzi che ragazze da una certa superiorità numerica, una superiore mobilità, o capacità di fecondazione di spermatozoi con caratteri maschili o per una delle mille altre possibili cause, perché per il Principio di Indifferenza, che fa parte del mio sistema fondamentale, la differenza osservata sarebbe così inverosimile se non ci fosse una tale differenza. Ma qui non sembra esserci una differenza fondamentale tra questo caso e la moneta truccata.

(19) Note sul problema di Poincaré ‘Perché gli eventi casuali sono soggetti ad una legge?’ La risposta principale a questo è che non lo sono, assumendo che nell’intero campo degli eventi casuali non sono possibili generalizzazioni su di essi (si pensi ad esempio alle malattie infettive, i dattili negli esametri, i morti per calci di cavalli, le nascite di grandi uomini).

Poincaré dice che è paradossale che l’attuario possa derivare dall’ignoranza così semplici ed utili conclusioni mentre se conoscesse le leggi della salute dovrebbe passare attraverso calcoli senza fine. In realtà egli opera non per ignoranza, ma per esperienza di frequenze.

(20) Nota su ‘casuale’.

Keynes 1 fornisce un resoconto sostanzialmente corretta di questo. Ma

(a) E’ essenziale introdurre il concetto di una descrizione.  Quello che vogliamo non è che a sia un membro  casuale di Schermata 2013-08-22 alle 18.42.59      (Sx) con lo scopo φx, ma la descrizione (ιx)(ψx) è una descrizione casuale quando x= (ιx)(ψx) è trascurabile rispetto a φx/Sx.h.

(b) E’ indispensabile estendere il termine per coprire non solo una selezione di un  termine, ma di molti; quindi, che ψ  Schermata 2013-08-22 alle 18.42.59      fornisce una selezione casuale di n di S in riferimento a φ Schermata 2013-08-22 alle 18.42.59   significa che a= Schermata 2013-08-22 alle 18.42.59    (ψx) è irrilevante alla probabilità nella forma: Rapporto di α che è φ= λ/α∊n.α⊃ Schermata 2013-08-22 alle 18.42.59   (S(x).h.

L’idea di selezione casuale è utile nell’induzione, in cui il valore del ragionamento ‘Un rapporto λ su ψS è uguale a φ’ ∴ che ‘ Un rapporto λ su S è uguale a φ’ dipende se ψ è un selettore casuale. Se λ=1 naturalmente il valore del ragionamento è rafforzato se ψ è affetto da errore sistematico contro φ, indebolito se φ è affetto da errore sistematico in favore di questo.

Treatise on Probability, P.291.

DAL CAP. IX Ultime carte (1929):

C. PROBABILITA’ E CONVINZIONE PARZIALE

Il difetto del mio saggio sulla probabilità era che ho assunto la convinzione parziale come un fenomeno psicologico definibile e misurabile  da uno psicologo. Ma questo tipo di psicologia è molto poco accettabile e sarebbe abbastanza inaccettabile in una scienza sviluppata. In effetti la nozione di un grado di convinzione 2/3 è inutile per un osservatore esterno, tranne quando viene usato dallo stesso che pensa e che dice: ‘Be’, io credo in una certa misura 2/3′, vale a dire (almeno questo è l’interpretazione più naturale)’ Ho lo stesso grado di convinzione in questo come in p v q quando io considero p,q,r ugualmente verosimili e so che uno di essi è vero.’ Ora, qual è il concetto di questo confronto numerico? come viene utilizzato il numero? In un grande numero di casi viene utilizzato semplicemente come base per ottenere altri numeri dello stesso tipo derivandone alla fine in un caso circa prossimo a zero o ad 1 che viene assunto essere 0 o 1 e la parziale convinzione essere una completa convinzione. Ma a volte il numero viene assunto per sé stesso nel prendere una decisione concreta. Come? Vorrei dire conformemente alla legge della speranza matematica, ma non posso farlo, perché potremmo usare solo questa regola se avessimo misurato buoni e cattivi risultati. Ma forse in un certo modo ci avviciniamo ad essa, come avremmo supposto in economia di massimizzare un’utilità non misurata. Il problema si pone anche sul perché proprio questa legge di speranza matematica. La risposta a questo è che se usiamo la probabilità per misurare l’utilità, come spiegato nel mio articolo, allora la coerenza richiede proprio questa legge. Naturalmente se l’utilità fosse misurata in qualsiasi altro modo, ad esempio in denaro, non dovremmo usare la speranza matematica.

Se non sussiste alcun significato nell’equivalente differenza di utilità, allora il denaro è un metodo buono come un altro per misurarla. Un significato può, tuttavia, essere fornito dal nostro metodo probabilistico, o mediante il tempo: ad esempio x – y = y – z se x per 1 giorno e z per 1 giorno = y per 2 giorni. Ma i periodi devono essere lunghi o associato con vite o persone diverse per evitare l’influenza reciproca. Questi due metodi portano allo stesso risultato? Potremmo provarlo con Bernoulli? Ovviamente no; Bernoulli valuta solo le probabilità. Un uomo potrebbe considerare una cosa buona e una cattiva equivalenti a 2 neutre, ma considerare 2 cattive semplicemente come pessime, che non vale la pena di assumere qualsiasi probabilità su di esse (Ma potrebbe essere fatto! No, ci dovrebbe essere una probabilità di non esserlo.) Credo che questo dimostra che il mio metodo di misurazione sia migliore; ma vale solo nell’insieme.

Tutto questo è solo un’idea, che senso c’è davvero in esso? Si può dire, credo, questo: –

Una teoria è un insieme di proposizioni che contiene p e q quando contiene p e q, e se

contiene una qualsiasi p contiene tutte le sue conseguenze logiche. L’interesse di tali insiemi viene dalla possibilità di adottarne una di queste come tutti noi crediamo opportuno.

Una teoria della probabilità è un insieme di numeri associati a coppie di proposizioni che obbediscono al calcolo delle probabilità. L’interesse di tale insieme deriva dalla possibilità di agire su di essi in modo coerente.

Naturalmente, il matematico si occupa solo della forma della probabilità; ma è abbastanza vero che si occupa solo di certezze.

TRUTH AND PROBABILITY- Cap. VII di The Foundation of Mathematics di Frank Plumpton Ramsey

21 Giu

Dennis V. LindleyPropongo la mia traduzione del settimo capitolo di The Foundation of Mathematics di Frank Ramsey pubblicato a cura di R.B. Braithwaite.

Questo capitolo è la base dei moderni sistemi di valutazione in condizioni di incertezza. Grazie a questa magnifica elaborazione matematica di temi complessi e ragionamenti solo in parte elaborati da altri autori tra cui Wittgenstein, Donkin, Pierce e Blake Ramsey ha costruito un sistema matematico solido e straordinariamente valido per la valutazione delle scelte umane basato sull’inscindibilità dei due elementi soggettivi probabilità e utilità dell’esito delle decisioni. Questa metodologia è valida solo per un mondo non deterministico (quindi è il logico e necessario superamento del galileismo nella scienza), libero e razionale. Ramsey prende le mosse dalla contestazione, dal punto di vista logico, dell’ipotesi di Keynes che si possano costruire algoritmi per definire la probabilità in modo oggettivo. Tale metodologia è, purtroppo, ancora in uso da parte di importanti istituzioni pubbliche con la sola finalità di definire le condizioni per non avere problemi con la giustizia se si applicano queste formule. Ma generalmente determina gravi errori di valutazione in quanto rappresenta un metodo per rendere oggettiva una grandezza che non può esserlo in quanto dipende oltre che dalla storia del decisore, dal suo carattere e dal sentimento di utilità che egli attribuisce ad una determinata decisione.

La linea di pensiero di Ramsey è anche importante perché esclude la possibilità di far coincidere l’utilità delle scelte con la teoria filosofica dell’Utilitarismo (qui credo sia ben presente l’influenza di Ludwig Wittgenstein). Si tratta infatti di elementi che apparentemente e solo in taluni casi appaiono convergenti, ma in realtà sono concetti del tutto diversi. L’utilità di una decisione è un numero compreso tra 0 e 1 in quanto si può definire come la probabilità di ottenere la conseguenza migliore per effetto di una decisione.

Rammento ai lettori che il prof. Dennis V. Lindey ha pubblicato sull’argomento un libro divulgativo (Making Decisions- John Wiley and Sons Ltd- 1985) per l’uso del metodo di Ramsey che permette in modo semplice di valutare la coerenza di una decisione indicando i passaggi necessari per pervenirvi. Il concetto di coerenza per le proprie scelte, legato quindi a regole personali, è per definizione un metodo soggettivo che riguarda il singolo decisore.

Il lavoro di Lindley andrebbe completato con l’analisi delle tendenze psicologiche del decisore per rendere maggiormente utile il sistema. 

Il metodo di Keynes, che non tiene conto di questo, porta necessariamente ad errori di valutazione perché è uguale per tutti i decisori. In ultima analisi è un metodo che potrebbe essere gradito ai regimi totalitari o comunque a quei sistemi politici che non considerano la libertà un bene fondamentale e fondante della natura umana.

VII

VERITA’ E PROBABILITÀ (1926)

Dire di che quello che è che non è e di quello che non è che è, è falso mentre il dire di quello che è che è e di quello che non è che non è, è vero. – Aristotele.

Quando diverse ipotesi si presentano alla nostra mente che riteniamo essere reciprocamente esclusive ed esaustive, ma di cui non sappiamo altro, noi distribuiamo equamente la nostra convinzione tra queste…..

Ammettendo questo come motivo del modo in cui effettivamente distribuiamo la nostra convinzione in casi semplici, tutta la successiva teoria segue come deduzione del modo in cui dobbiamo distribuirla in casi complessi, se vogliamo essere coerenti. – W.F. Donkin.

L’oggetto del ragionamento è quello di scoprire, dalla considerazione di quello che già sappiamo, qualcos’altro che non sappiamo. Di conseguenza, il ragionamento è buono  se è tale da dare una vera conclusione da premesse vere, e non altrimenti. – C.S. Peirce.

La verità non può mai essere presentata come se sia da comprendere, e non come se sia da credere. – W. Blake.

PREMESSA

In questo saggio la teoria della probabilità è assunta come un ramo della logica, la logica della parziale convinzione e di materia non completamente definita; ma non vi è alcuna intenzione di implicare che questo è l’unico e anche il più importante aspetto del discorso. La probabilità è di fondamentale importanza non solo nella logica, ma anche nella scienza statistica e nella fisica, e non possiamo essere sicuri in anticipo che la più utile interpretazione di essa nella logica sarà appropriata anche nella fisica. Infatti la differenza principale di opinione fra gli statistici che per la maggior parte adotta la teoria della probabilità sulla base della frequenza e i logici che per lo più la respingono rende probabile che le due scuole stiano veramente discutendo differenti questioni, e che la parola ‘probabilità’ venga usata dai logici in un senso e dagli statistici in un altro. Le conclusioni a cui arriveremo circa il significato di probabilità in logica non devono, pertanto, pregiudicare il suo significato nella fisica.1

1 [Il capitolo finale, sulla probabilità nella scienza, è stato progettato ma non scritto. – Ndr].

SOMMARIO

(1) La teoria della frequenza

(2) La teoria di Keynes

(3) Il gradi di convinzione

(4) La logica della coerenza

(5) The Logica della verità

(1) LA TEORIA  DELLA FREQUENZA

Nella speranza di evitare alcune controversie puramente verbali, mi propongo di iniziare facendo qualche ammissione a favore della teoria della frequenza. In primo luogo, a questa teoria deve essere concesso di avere una solida base nel linguaggio comune, che utilizza spesso ‘probabilità’ praticamente come sinonimo di proporzione; per esempio, se diciamo che la probabilità di guarigione dal vaiolo è di tre quarti, si intende, credo, semplicemente che questa sia la proporzione di casi di vaiolo che guariscono. In secondo luogo, se iniziamo con quello che viene chiamato il calcolo delle probabilità, considerandolo dapprima come un ramo della matematica pura, e poi guardandosi intorno per qualche interpretazione delle formule, che devono dimostrare che i nostri assiomi sono coerenti e il nostro argomento non del tutto inutile, allora la molto più semplice e la meno controversa interpretazione del calcolo è quella in termini di frequenze. Questo è vero non solo della ordinaria matematica della probabilità, ma anche del calcolo simbolico sviluppato da Keynes; perché se nel suo a / h, a e h sono prese per essere non proposizioni, ma funzioni proposizionali o concetti-classe che definiscono classi finite, e per a/h si intende la proporzione di membri di h che sono anche membri di a, allora tutte le sue proposizioni diventano truismi aritmetici.

Oltre a queste due inevitabili considerazioni, ce n’è una terza e più importante, che io sono pronto ad assumere temporaneamente anche se non esprime la mia vera opinione. E questa è la seguente. Supponiamo di Iniziare con il calcolo matematico, e chiedere, non come prima cosa quale interpretazione di esso sia più comoda per il matematismo puro, ma quale interpretazione fornisce i risultati di maggior valore per la scienza in generale, allora può essere che la risposta sia ancora una volta un’interpretazione in termini di frequenza; questa probabilità come viene utilizzata in teorie statistiche, in particolare in meccanica statistica – il tipo di probabilità il cui logaritmo è l’entropia – è realmente un rapporto tra i numeri, di due classi, o il limite di quel rapporto. Non ci credo, ma sono disposto per ora a concedere alla teoria della frequenza che questa probabilità come utilizzata nella scienza moderna sia in realtà la stessa cosa della frequenza.

Ma, supponendo tutto ciò ammesso, rimane ancora il caso che noi abbiamo sia l’autorità del linguaggio comune sia di molti grandi pensatori per discutere sotto il titolo di probabilità quello che sembra essere piuttosto un argomento diverso, la logica della convinzione parziale. Può darsi che, come alcuni sostenitori della teoria della frequenza hanno sostenuto, la logica della convinzione parziale si troverà alla fine essere semplicemente lo studio delle frequenze, sia perché la convinzione parziale sarebbe definibile come, o per relazione, una sorta di frequenza, o perché può essere oggetto di un trattamento logico solo quando si fonda sulla frequenze sperimentali. Se queste affermazioni sono valide possono tuttavia essere stabilite solo come un risultato della nostra indagine sulla convinzione parziale, così che io propongo di ignorare la teoria della frequenza al presente e avviare un’indagine sulla logica della convinzione parziale. In questo, credo, sarà più conveniente se, invece di sviluppare da subito la mia teoria, comincio esaminando le opinioni di Keynes, che sono così ben conosciute e in sostanza così ampiamente accettate che i lettori probabilmente credono che non vi sia alcun motivo per riaprire il tema de novo fino a quando siano state demolite.

(2) LA TEORIA DI KEYNES

Keynes 1 parte dal presupposto che facciamo inferenze di probabilità per le quali asseriamo una validità oggettiva; si procede dalla convinzione piena in una proposizione alla convinzione parziale in un’altra, e noi riteniamo che questa procedura è oggettivamente giusta, in modo che se un altro uomo in circostanze simili avesse un diverso grado di convinzione, in questo sbaglierebbe. La ragione di questa ipotesi di Keynes è di supporre  che fra due qualsiasi proposizioni, date come premesse e conclusioni, esiste solo una ed una sola relazione di un determinato tipo definito relazione di probabilità;  e questo se, in qualsiasi caso dato, la relazione sia di grado α, dalla totale convinzione nelle premessa, noi possiamo, se siamo razionali, pervenire ad un grado di convinzione α nella conclusione.

Prima di criticare questo punto di vista, potrebbe forse essermi consentito di segnalare un evidente e facilmente correggibile difetto nella sua definizione. Quando viene detto che il grado della relazione di probabilità è la stessa del grado di convinzione che la giustifica, sembra essere presupposto che sia i rapporti di probabilità, da un lato, ed i gradi di convinzione, dall’altro possano essere naturalmente espressi in termini numerici e quindi che il numero che esprime o misura il rapporto di probabilità è lo stesso che esprime l’appropriato grado di convinzione. Ma se, come sostiene Keynes, queste cose non sono sempre esprimibili con i numeri, allora non possiamo porre la sua affermazione che il grado dell’una  sia lo stesso dell’altra come una semplice interpretazione, ma si deve supporre che pensi soltanto che esista una corrispondenza biunivoca tra i rapporti di probabilità e i gradi di convinzione che li giustificherebbe. Questa corrispondenza deve conservare evidentemente le relazioni di maggiore e minore, e rendere la varietà delle relazioni di probabilità e quella di gradi di convinzione simili nel senso di Russell. Penso che sia un peccato che Keynes non ha visto questo chiaramente, perché l’esattezza di questa corrispondenza avrebbe fornito materia abbastanza degna per il suo scetticismo come fece sulla misura numerica dei rapporti di probabilità. Infatti alcuni dei suoi argomenti contro la loro misura numerica sembra si applichino abbastanza altrettanto bene contro la loro esatta corrispondenza con i gradi di convinzione; per esempio, sostiene che se i tassi di assicurazione corrispondessero a soggettivi, cioè reali, gradi di convinzione, questi non sarebbero razionalmente determinati, e non potremmo dedurre che le relazioni di probabilità possano essere misurate allo stesso modo. Si potrebbe sostenere che la vera conclusione in tal caso non sarebbe che, come pensa Keynes, alla relazione non -numerica di probabilità  corrisponda un non-numerico grado di convinzione razionale, ma che i gradi di convinzione, che sarebbero sempre numerici, non hanno una corrispondenza biunivoca con le relazioni di probabilità che le giustificano. Perché è, suppongo, concepibile che i gradi di convinzione possano essere misurati da uno psicogalvanometro o qualche strumento simile, e Keynes difficilmente desidererebbe che da ciò seguirebbe che i rapporti di probabilità possano essere per derivazione misurati con le misure delle convinzioni che li giustificano.

1 J.M. Keynes, A Treatise on Probability (1921).

Ma torniamo a una critica più fondamentale delle opinioni di Keynes, che è quell’ovvietà che realmente non sembra che esistano oggetti come i rapporti di probabilità che lui descrive. Lui suppone che, comunque in alcuni casi, possano essere percepiti; ma per quanto mi riguarda mi sento fiducioso che questo non è vero. Io non li percepisco, e se devo essere convinto che esistono, deve essere fatto con ragione; inoltre ho avvedutamente il sospetto che anche gli altri non li percepiscano, perché sono in grado di raggiungere un così piccolo accordo come con quello di essi che si riferisce ad ogni due date proposizioni. Tutto quello che sembra di sapere su di questo sono alcune proposizioni generali, le leggi di addizione e moltiplicazione; è come se tutti conoscessero le leggi della geometria, ma nessuno potesse dire se ogni determinato oggetto fosse rotondo o quadrato; e trovo difficile immaginare come una massa così grande di conoscenza generale possa essere combinata con una così esigua riserva di fatti particolari. E’ vero che su alcuni casi particolari vi sia un accordo, ma questi in qualche modo, paradossalmente, sono sempre immensamente complicati; siamo tutti d’accordo che la probabilità di una moneta lanciata sia testa è 1/2, ma nessuno di noi può dire esattamente quale è la prova che costituisce l’altro termine per la relazione di probabilità intorno alla quale noi stiamo facendo valutazioni. Se, invece, prendiamo le più semplici  coppie possibili di proposizioni come ‘Questo è rosso’ e ‘Questo è blu’ o ‘Questo è rosso’ e ‘Quello è rosso’, le cui relazioni logiche dovrebbero essere le relazioni sicuramente più facili da osservare, nessuno, credo, avrebbe la presunzione di essere sicuro di quale sia la relazione di probabilità che le collega. O, forse, si può pretendere di vedere la relazione, ma non saranno in grado di dire nulla su di essa con certezza, di affermare se sia più o meno di 1/3, o così via. Essi possono, naturalmente, dire che è incomparabile con qualsiasi rapporto numerico, ma una relazione su ciò che così poco può essere detto in modo veritiero sarebbe di scarso uso scientifico e sarebbe difficile convincere uno scettico della sua esistenza. Inoltre questo punto di vista è davvero un po’ paradossale, perché ogni persona che crede nell’induzione deve ammettere che tra ‘Questo è rosso’ come conclusione e ‘Questo è rotondo’, insieme a un miliardo di proposizioni della forma ‘a è rotondo e rosso ‘come prova, c’è una relazione di probabilità finita; ed è difficile supporre che come abbiamo accumulato casi di prova questi sono improvvisamente ad un punto, ad esempio dopo 233 prove, nel quale la relazione di probabilità diventa finita e così comparabile con qualche rapporto numerico.

Mi sembra che se prendiamo le due proposizioni ‘a è rosso’, ‘b è rosso’, non possiamo discernere più di quattro semplici relazioni logiche tra di esse, vale a dire l’identità di forma, identità di predicato, la diversità del soggetto, e l’indipendenza logica di significato. Se qualcuno mi chiedesse quale probabilità darei all’una e all’altra, non dovrei cercare di rispondere meditando sulle proposizioni e cercando di discernere una relazione logica tra di esse, dovrei, piuttosto, provare ad immaginare che una di quelle sia  tutto quello che sapevo, e ad indovinare quale grado di convinzione dovrei avere poi nell’altra. Se io sono stato in grado di fare questo, potrei senza dubbio ancora non essere contento con questo, ma potrei dire ‘Questo è quello che penserei, ma, naturalmente, io sono solo un pazzo ‘e procederei a considerare ciò che un uomo saggio potrebbe pensare e chiamare questo il grado di probabilità. Io discuterò più tardi questo tipo di autocritica, quando svilupperò la mia teoria; tutto ciò che voglio sottolineare qui è che nessuno che valuta un grado di probabilità prende in considerazione semplicemente  le due proposizioni che si suppone essere correlate con esso; egli sempre considera, tra l’altro il suo proprio grado di convinzione effettivo o ipotetico. Questa osservazione mi sembra essere confermata dalla osservazione del mio comportamento; e per essere l’unico modo di rendere conto del fatto che tutti possiamo fornire stime di probabilità in casi presi dalla vita reale, ma siamo del tutto incapaci di farlo nei casi logicamente più semplici in cui, fosse la probabilità una relazione logica, sarebbe più facile da discernere.

Un altro argomento contro la teoria di Keynes può, credo, essere tratto dalla sua incapacità di aderire ad essa coerentemente anche nella discussione principi primi. C’è un passaggio nel suo capitolo sulla misura della probabilità che recita quanto segue: “La probabilità, vedi capitolo 11 (§ 12), relativa in un certo senso ai principi della ragione umana. Il grado di probabilità, che è razionale per noi prendere in considerazione, non ha la pretesa di una intuizione logica perfetta, ed è relativa in parte alle proposizioni secondarie che in realtà conosciamo; e non dipende se una visione logica più perfetta è o non è concepibile. E’ il grado di probabilità a cui conducono questi processi logici, di cui le nostre menti sono capaci; o, nel linguaggio del capitolo II, che quelle proposizioni secondarie giustificano, che in realtà conosciamo. Se non assumiamo questo punto di vista sulla probabilità, se non la limitiamo in questo modo e lo rendiamo, fino a questo punto, relativamente ai poteri umani, siamo del tutto alla deriva nell’ignoto; perché non possiamo mai sapere quale grado di probabilità sarebbe giustificato dalla percezione di relazioni logiche che noi siamo, e sempre dobbiamo essere, incapaci di comprendere.” 1

Questo passaggio mi sembra abbastanza inconciliabile con il punto di vista che Keynes adotta dappertutto tranne in questo e un altro passo simile. Perché egli sostiene in generale che il grado di convinzione che siamo giustificati nel mettere alla conclusione di un argomento è determinato da quale relazione di probabilità unisce tale conclusione alle nostre premesse. C’è un solo rapporto di questo tipo e di conseguenza una sola vera pertinente proposizione secondaria, che, ovviamente, posso o non posso conoscere, ma che è necessariamente indipendente dalla mente umana. Se noi non lo sappiamo, non lo sappiamo e non possiamo dire quanto dovremmo credere nella conclusione. Ma spesso, egli suppone, che noi lo sappiamo;  i rapporti di probabilità non sono quelli che siamo incapaci di comprendere. Ma su questo punto di vista l’argomento del passo sopra citato non ha alcun significato: le relazioni che giustificano le probabili convinzioni sono relazioni di probabilità, e non ha senso dire di loro che sono giustificate da relazioni logiche che noi siamo, e dobbiamo sempre essere, incapaci di comprendere.

Il significato del passaggio per il nostro scopo attuale sta nel fatto che esso sembra presupporre un diverso punto di vista sulla probabilità, in cui rapporti di probabilità indefinibili non giocano alcun ruolo, ma in cui il grado di convinzione razionale dipende da una varietà di relazioni logiche. Per esempio, ci potrebbe essere tra la premessa e la conclusione la relazione che la premessa era il prodotto logico di un migliaio esempi di una generalizzazione la conclusione della quale era un altro esempio, e questa relazione, che non è un rapporto di probabilità indefinibile ma definibile in termini di logica ordinaria e così facilmente riconoscibile, potrebbe giustificare un certo grado di convinzione nelle conclusioni da parte di uno che credesse nelle premesse. Dovremmo quindi avere una varietà di ordinarie relazioni logiche che giustificano lo stesso o gradi diversi di convinzione. Dire che la probabilità di a dato h era così e così significherebbe che tra a e h esiste una relazione che giustifichi tale-e-tale grado di convinzione. E da questo punto di vista sarebbe un vero e proprio punto essenziale che la relazione in questione non deve essere una relazione che la mente umana sia incapace di comprendere.

1 p. 32, corsivo nel testo.

Questo secondo punto di vista della probabilità come dipendente da relazioni logiche, ma non per sé una nuova relazione logica mi sembra più plausibile della usuale teoria di Keynes; ma questo non vuol dire che mi sento affatto propenso a concordare con lui. Questo richiederebbe  l’idea un po ‘oscura di una relazione logica che giustifica un  grado di convinzione, che non vorrei accettare come indefinibile perché non sembra essere del tutto un concetto chiaro e semplice. Inoltre è difficile dire quali relazioni logiche giustificano quali gradi di convinzione, e perché; qualsiasi decisione in questo senso sarebbe arbitraria, e porterebbe ad una logica di probabilità costituita da una moltitudine di cosiddetti “necessari” fatti, come la logica formale secondo il punto di vita di  Chadwick sulle constanti logiche. 1 Al contrario io penso sia molto meglio cercare una spiegazione di questa ‘necessità sul modello di lavoro di Wittgenstein, che ci permette di vedere chiaramente in quale preciso senso e perché le proposizioni logiche sono necessarie, e in maniera generale perché il sistema della logica formale è composto di  proposizioni di cui è composto, e quale è la sua caratteristica comune. Come la scienza naturale cerca di spiegare e calcolare i fatti della natura, così la filosofia dovrebbe cercare, in un certo senso, di spiegare e calcolare i fatti di logica; un compito ignorato dalla filosofia che respinge questi fatti come non calcolabili e in un senso indefinibile ‘necessari’.

Qui mi propongo di concludere questa critica della teoria di Keynes, non perché non ci siano altri aspetti nei quali sembra offrire il fianco ad obiezioni, ma perché spero che quello che ho già detto sia sufficiente a dimostrare che non è così del tutto soddisfacente da rendere inutile qualsiasi tentativo di trattare la teoria da un punto di vista piuttosto diverso.

J.A. Chadwick “Logical Constants”, Mind, 1927.

(3) GRADI DI CONVINZIONE

L’oggetto della nostra indagine è la logica della convinzione parziale, e non credo che possiamo affrontarla a meno che abbiamo almeno una nozione approssimativa di ciò che sia la convinzione parziale, e come, se non altro, può essere misurata. Non sarà molto illuminante sentirsi dire che in certe circostanze sarebbe razionale credere una proposizione nella misura di 2/3, a meno che sappiamo che cosa significa questo tipo di convinzione in ciò. Dobbiamo quindi cercare di sviluppare un metodo puramente psicologico della misura della convinzione. Non è abbastanza misurare la probabilità; al fine di assegnare correttamente la nostra convinzione alla probabilità dobbiamo anche essere in grado di misurare la nostra convinzione. E’ comune opinione che la convinzione e altre variabili psicologiche non siano misurabili, e se questo fosse vero la nostra indagine sarebbe vana;  e così sarebbe tutta la teoria della probabilità concepita come la logica della parziale convinzione; perché se la frase ‘una convinzione di due terzi di certezza’ fosse priva di significato, un calcolo il cui unico obiettivo sia imporre tali convinzioni sarebbe anche privo di senso. Quindi a meno che non siamo disposti a rinunciare a tutta la faccenda come un cattivo lavoro noi siamo tenuti a sostenere che le convinzioni possono in qualche misura essere misurate. Se dovessimo seguire l’analogia di Keynes nel trattare le probabilità dovremmo dire che alcune convinzioni sarebbero misurabili e altre no; ma questa probabilmente non mi sembra essere un considerazione corretta della questione: non vedo come si possa dividere nettamente le convinzioni in quelle che hanno una posizione nella scala numerica e quelli che non l’hanno. Ma penso che le convinzioni si differenziano in misurabilità nei seguenti due modi. In primo luogo, alcune convinzioni  possono essere misurate più accuratamente di altre; e, in secondo luogo, la misurazione delle convinzioni è abbastanza certamente un processo ambiguo che conduce ad una risposta variabile a seconda di come esattamente la misurazione viene effettuata. Il grado di convinzione a questo proposito è come l’intervallo di tempo tra due eventi; prima di Einstein si considerava che tutti i metodi ordinari di misura di un intervallo di tempo avrebbero dovuto portare allo stesso risultato se effettuata correttamente. 1  Einstein ha dimostrato che questo non era il caso; e l’intervallo di tempo non può più essere considerato come una nozione precisa, ma deve essere abbandonato in tutte le indagini precise. Tuttavia, l’intervallo di tempo e il sistema newtoniano sono sufficientemente accurati per molti scopi e più  facili da applicare. Cercherò di argomentare in seguito che il grado di una convinzione è come un intervallo di tempo; non ha un preciso significato a meno che si specifichi più precisamente come debba essere misurato. Ma per molti scopi possiamo supporre che i modi alternativi di misurarlo portano allo stesso risultato, anche se questo è solo approssimativamente vero. Le discrepanze risultanti sono più evidenti in connessione con alcune convinzioni che con altre, e queste dunque appaiono meno misurabili. Entrambi questi tipi di carenze nella misurabilità, dovuti rispettivamente alla difficoltà di ottenere una misura sufficientemente esatta e ad una importante ambiguità nella definizione del processo di misura, si verificano anche nella fisica e così non sono difficoltà peculiari del nostro problema; quello che è peculiare è che è difficile formulare qualsiasi idea di come la misurazione debba essere effettuata, come l’unità di misura si debba ricavare, e così via. Consideriamo quindi ciò che è implicito nella misurazione delle convinzioni. Un sistema soddisfacente deve in primo luogo assegnare ad ogni convinzione una grandezza o misura avente una precisa posizione in un ordine di grandezza; convinzioni che siano dello stesso grado di convinzione devono  avere la stessa misura dell’una e dell’altra, e così via. Naturalmente questo non può essere realizzato senza introdurre una certa quantità di ipotesi o invenzioni. Anche in fisica non si può sostenere che oggetti che sono uguali a qualche cosa siano uguali l’uno all’altro senza porre ‘uguale’ non con il significato ‘percettibilmente uguale’, ma come un’invenzione o una relazione ipotetica. Non voglio discutere la metafisica o epistemologia di questo processo, ma solo  sottolineare che se è ammissibile in fisica, sarà anche ammissibile in psicologia. La semplicità logica caratteristica delle relazioni trattate in una scienza non viene ottenuta per sua sola natura senza alcuna mescolanza con l’invenzione. Ma il costruire una tale serie ordinata di gradi non è tutto l’insieme del nostro lavoro; dobbiamo anche assegnare valori numerici a questi gradi in qualche modo intelligibile. Ovviamente possiamo facilmente spiegare che indichiamo piena convinzione con 1, la convinzione piena nell’opposto con 0, e le uguali convinzioni in una proposizione e la sua contraddizione con 1/2. Ma non è così semplice dire cosa si intende con una convinzione di certezza pari a 2/3, o che una convinzione in una proposizione sia due volte più forte che la sua contraddizione. Questa è la parte più difficile del lavoro, ma è assolutamente necessaria; perché noi calcoliamo le probabilità numeriche, e se queste corrispondono al grado di convinzione noi dobbiamo scoprire qualche modo definito di assegnare numeri ai gradi di convinzione. In fisica spesso si attribuiscono i numeri scoprendo un processo fisico di addizione 1: il numero per la misura di lunghezze non viene assegnato arbitrariamente soggetto soltanto alla condizione che una maggiore lunghezza deve avere una misura più grande; noi la determiniamo ulteriormente stabilendo un significato fisico per l’addizione; la lunghezza ottenuta mettendo insieme due date lunghezze deve avere per la sua misura la somma delle singole misure. Un sistema di misura in cui non vi è nulla che corrisponde a questo viene immediatamente riconosciuto come arbitrario, per esempio la scala di durezza 1 di Mohs in cui 10 è assegnato arbitrariamente al diamante, il materiale più duro conosciuto, 9 al successivo più duro, e così via.

1 Vedi N. Campbell, Physics The Elements (1920), p.277.

1 Ibid., p.271.

Dobbiamo quindi trovare un processo di addizione per i gradi di convinzione, o un qualche  sostituto a questo che sia ugualmente adeguato a definire una scala numerica. Questo è il nostro problema: come si risolve? Ci sono, credo, due modi da cui possiamo iniziare. Possiamo, in primo luogo, supporre che il grado di una convinzione sia qualcosa di percepibile da chi lo possiede; ad esempio che le convinzioni differiscano nell’intensità della sensazione da cui sono accompagnate, che potrebbe essere chiamata un sentimento di convinzione o sensazione di convincimento, e che per grado di convinzione intendiamo l’intensità di questo sentimento. Questo punto di vista sarebbe molto scomodo, perché non è facile attribuire numeri all’intensità dei sentimenti; ma a parte questo mi sembra palesemente falso, perché le convinzioni che abbiamo più fortemente sono spesso accompagnate praticamente affatto da nessuna sensazione;  nessuno sente fortemente cose che dà per scontate. Siamo quindi condotti alla seconda ipotesi che il grado di una convinzione sia una proprietà causale di ciò, che possiamo esprimere vagamente come il campo di applicazione in cui siamo pronti ad agire con esso. Questa è una generalizzazione del noto punto di vista, che la differenza di convinzione sta nella sua efficacia causale, che viene discusso da Russell nella sua Analysis of Mind. Egli in quell’opera la respinge per due motivi, uno dei quali sembra completamente mancare il punto. Egli sostiene che nel corso della serie dei pensieri, noi concepiamo molte cose che non danno luogo ad azione. Questa obiezione, tuttavia, è vicina a cogliere nel segno, in quanto non si afferma che una convinzione sia un’idea che effettivamente porta ad una azione, ma che porterebbe all’azione in opportune circostanze; proprio come una zolletta di arsenico è detta velenosa, non perché in realtà ha ucciso o ucciderà qualcuno, ma perché potrebbe uccidere chiunque la mangiasse. Il secondo argomento di Russell, tuttavia, è più arduo. Egli fa notare che non è possibile supporre che le convinzioni differiscano dalle altre idee solo per i loro effetti, perché altrimenti se fossero identiche anche i loro effetti sarebbero identici. Questo è perfettamente vero, ma può ancora restare il caso che la natura della differenza tra le cause sia o completamente sconosciuta o molto vagamente nota, e che quello di cui vogliamo parlare sia la differenza tra gli effetti, che è immediatamente osservabile e rilevante. Non appena noi consideriamo una convinzione quantitativamente, questo mi sembra l’unico punto di vista che possiamo avere su di essa. Si potrebbe giustamente considerare che la differenza tra credere e non credere stia nella presenza o assenza di sentimenti introspettivamente. Ma quando cerchiamo di conoscere quale sia la differenza tra credere con più certezza e credere con meno certezza, non possiamo più considerarlo come definibile nell’avere più o meno di una certa sensazione osservabile; almeno io personalmente non sono in grado di riconoscere sentimenti di questo genere. Mi sembra che la differenza si trovi in fino a che punto dovremmo agire in base a queste convinzioni: questo può dipendere dal grado di qualche sensazione o sensazioni, ma non so esattamente quali sensazioni e non penso che sia indispensabile che le conosciamo. Proprio la stessa cosa si trova nella fisica; si è trovato che un cavo che collega lastre di zinco e rame poste in un acido devia un ago magnetico posto nelle sue vicinanze. Di conseguenza, se l’ago viene più o meno deviato si dice che il filo elettrico porta una corrente più o meno grande. La natura di questa ‘corrente’ può essere solo ipotizzata: quello che viene osservato e misurato sono semplicemente i suoi effetti. Si può senza dubbio obiettare che noi sappiamo con quanta forza crediamo in oggetti, e che possiamo conoscere questo solo se siamo in grado di misurare la nostra convinzione per introspezione. Questo non mi sembra necessariamente vero;  in molti casi, credo, il nostro giudizio sulla forza della nostra convinzione è realmente su come agiremmo in ipotetiche circostanze. Si potrebbe rispondere che possiamo solo dire come agiremmo osservando l’attuale sensazione di convincimento che determina il modo in cui agiremmo; ma ancora una volta dubito la cogenza dell’argomento. E’  possibile che ciò che determina il modo in cui agiremmo ci determina anche, direttamente o indirettamente ad avere una corretta opinione su come agiremmo,  senza che ciò mai giunga nella consapevolezza. Supponiamo, tuttavia, che mi sbagli su questo e che possiamo decidere per introspezione la natura della convinzione, e misurarne il grado; pertanto, io sosterrei, il tipo di misura di convinzione con cui la probabilità è interessata non è di questo tipo, ma è una misura della convinzioni su qualche base di azione. Questo io penso si possa mostrare in due modi. In primo luogo, considerando la scala di probabilità tra 0 e 1, e il tipo di modo di usarlo, vedremo che è molto appropriato per la misura della convinzione come base di un’azione, ma in nessun modo correlato alla misura di una introspettiva sensazione. Perché le unità nei termini in cui  sono misurate tali sensazioni o sentimenti sono sempre, penso, differenze che sono appena percettibili: non c’è altro modo di ottenere tali unità. Ma non vedo alcuna ragione per supporre che l’intervallo tra una convinzione di grado 1/3 e una di grado 1/2 sia composto da alquante appena percettibili modifiche così come quella tra una di 2/3 ed una di 5/8, o che questa scala basata su appena percettibili differenze non avrebbe alcuna semplice relazione con la teoria della probabilità. D’altra parte la probabilità di 1/3 è chiaramente correlata al tipo di convinzione che porterebbe ad una scommessa di 2 a 1, e verrà illustrato di seguito come generalizzare questo rapporto in modo da applicarlo ad una azione in generale. In secondo luogo, gli aspetti quantitativi di convinzioni come base di azione sono evidentemente più importanti dell’intensità di una sensazione di convinzione. Questi ultimi sono senza dubbio interessanti, ma possono essere molto variabile da individuo a individuo, e il loro interesse pratico è interamente dovuto alla loro posizione di ipotetiche cause di convinzione per qualche fondamento di una azione. E’ possibile che qualcuno dirà che la misura in cui dovremmo agire sulla base di una convinzione in opportune circostanze è un oggetto ipotetico, e quindi non soggetto a misurazione. Ma dire questo è solo il rivelare l’ignoranza delle scienze fisiche che costantemente si occupano di misurare quantitativi ipotetici; per esempio, l’intensità elettrica in un dato punto è la forza che agirebbe su una carica unitaria se fosse messa in un dato luogo. Cerchiamo ora di trovare un metodo di misurare le convinzioni come fondamento di azioni possibili. E’ chiaro che noi siamo interessati all’intenzione piuttosto che alle convinzioni realizzate; vale a dire, non con le convinzioni al momento in cui pensiamo ad esse, ma alle mie convinzioni come la mia convinzione che la terra è rotonda, a cui raramente penso, ma che guiderebbe la mia azione in ogni caso in cui fosse rilevante. Il vecchio consolidato modo di misurare la convinzione di una persona è quello di proporre una scommessa, e vedere quale sarebbe la più bassa posta che egli accetterebbe. Considero questo metodo fondamentalmente valido, ma ha il difetto di non essere abbastanza generale, e di essere necessariamente inesatto. E’ inesatto parzialmente  a causa del decrescere dell’utilità marginale del denaro, in parte perché una persona può avere entusiasmo o riluttanza a scommettere, perché o gode o detesta questa emozione o per qualsiasi altro motivo, ad esempio, per scrivere un libro. La difficoltà è simile a quella di separare due differenti forze co-operanti. Inoltre, la proposta di una scommessa può alterare inevitabilmente lo stato della sua opinione; così come non potremmo sempre misurare l’intensità elettrica con una effettiva introduzione di una carica elettrica e osservando a quale forza essa è soggetta, perché l’introduzione di una carica cambia la distribuzione che si vuole misurare. Al fine quindi di costruire una teoria quantitativa della convinzione che sarebbe insieme generale ed più esatta, mi propongo di prendere come fondamento una teoria psicologica generale, che è ormai universalmente abbandonata, ma risulta comunque, credo, abbastanza vicina alla verità in una sorta di casi in cui noi siamo più interessati. Mi riferisco alla teoria che noi agiamo nel modo che pensiamo che più probabilmente realizzi gli oggetti del nostro desiderio, in modo che le azioni di una persona sono completamente determinate dai suoi desideri e dalle sue opinioni. Questa teoria non può risultare adeguata a tutti i fatti, ma mi sembra una utile approssimazione alla verità, soprattutto nel caso della nostra vita cosciente o professionale, ed è implicata in grande accordo con il nostro pensiero. Si tratta di una teoria semplice e una teoria che molti psicologi ovviamente gradirebbero mantenere attraverso l’introduzione di desideri inconsci e opinioni inconsce in al fine di renderla più in armonia con i fatti. Non mi sento di giudicare fino a che punto tali ipotesi possano ottenere i risultati richiesti: io solo l’affermo per ciò che segue da una verità approssimativa, o la verità in relazione a questo sistema artificiale di psicologia, che, come la meccanica newtoniana può, io credo, ancora essere utilizzata con profitto anche se è noto per essere errata. Si deve rilevare che questa teoria non deve essere identificata con la psicologia degli Utilitaristi, in cui il piacere ha una posizione dominante. La teoria che propongo di adottare è che cerchiamo le cose che vogliamo, che possono essere per nostro o di altrui piacere, o una qualsiasi altra cosa, e le nostre azioni si verificano per come riteniamo più probabile ottenere questi beni. Ma questa non è una precisa formulazione, perché una precisa formulazione della teoria può essere fatta solo dopo aver introdotto la nozione quantitativa di convinzione. Chiamiamo le cose che una persona desidera in definitiva, ‘beni’, e assumiamo in un primo momento che siano numericamente misurabili e additivi. Vale a dire che se lui preferisce di per sé un’ora di nuoto ad un’ora di lettura, egli preferirà due ore di nuoto a un’ora di nuoto e ad un’ora di lettura. Questo è ovviamente assurdo nel caso specifico, ma questo potrebbe essere solo perché il nuoto e la lettura non sono beni fondamentali, e perché non possiamo immaginare una seconda ora di nuoto esattamente simile alla prima, a causa dell’affaticamento, ecc. Cominciamo col supporre che il nostro soggetto non ha dubbi su nulla, ma sicure opinioni su tutte le proposizioni. Allora possiamo dire che sempre sceglierà il corso di azioni che porteranno secondo la sua opinione alla massima somma di bene. Va sottolineato che in questo esempio bene e male non sono da intendersi in nessun senso etico, ma semplicemente per indicare quello per cui una persona prova desiderio o avversione. Il problema quindi si pone su come dobbiamo modificare questo semplice sistema per tener conto dei diversi gradi di certezza nelle sue convinzioni. Suggerisco che si introduca come legge psicologica che il suo comportamento sia governato da quello che viene chiamato la speranza matematica; vale a dire che, se p è una proposizione su cui egli ha dubbi, ogni bene o male per la cui realizzazione p è a suo avviso una condizione necessaria e sufficiente entrerà nei suoi calcoli moltiplicata per quella frazione, che verrebbe chiamata il ‘grado della sua convinzione in p’. Definiamo così il grado di convinzione in un modo che presuppone l’uso della speranza matematica. Questo si può porre in un modo diverso. Supponiamo che il suo grado di convinzione in p sia m/n; allora la sua azione sarebbe tale come se egli dovesse scegliere di ripeterla esattamente n volte, in m volte delle quali p sarebbe vera, e nelle altre falsa. [Qui sarebbe necessario supporre che in ciascuna delle n volte egli non abbia memoria delle precedenti.] Questo può anche essere preso come una definizione del grado di convinzione, e può essere facilmente considerato come equivalente alla definizione precedente. Diamo un esempio del tipo di casi che potrebbero verificarsi. Io sono ad un bivio e non conosco la strada, ma io piuttosto penso che una delle due strade è quella giusta. Propongo quindi di andare in quella direzione, ma tengo gli occhi aperti per qualcuno a cui chiedere; se adesso vedo qualcuno a mezzo miglio di distanza oltre i campi, se devio per chiedere a lui dipenderà dal relativo disagio di andare fuori dalla mia strada per attraversare i campi o di proseguire sulla strada sbagliata se si tratta della strada sbagliata. Ma dipenderà anche da come sono sicuro che ho ragione; e chiaramente più Io sono sicuro di questo minore sarà la distanza che sarei disposto a percorrere dalla strada (in cui mi trovo) per controllare la mia opinione. Propongo pertanto di utilizzare la distanza che sarei disposto a percorrere per chiedere, come misura della fiducia nella mia opinione; e quello che ho detto sopra spiega come questo deve essere fatto. Possiamo iniziare come segue: supponiamo che l’inconveniente di percorrere x iarde per chiedere sia f(x), il vantaggio  di arrivare alla destinazione giusta sia r, quello di arrivare a quella sbagliata w. Quindi se proprio fossi disposto ad andare ad una distanza d per chiedere, il grado della mia convinzione che io sono sulla strada giusta sarebbe data da

Schermata 2013-12-27 alle 18.29.37

 

 

 

Per una tale azione ci sarebbe uno che mi pagherebbe per farla, se avessi dovuto agire nello stesso modo n volte, in np delle quali ero sulla strada giusta mentre nelle altre no.

Per il bene totale risultante dal non chiedere ogni volta

= npr + n(1-p) w

= nw + np (r – w)

che risulta dal chiedere ad una distanza x ogni volta = nr- nf(x) [io so che vado sempre nella strada giusta]

Questo è più grande dell’espressione precedente, a condizione che

f (x) <(r – w) (1-p),

∴ la distanza critica d è collegata con p, il grado di convinzione, con la relazione f (d) = (r – w) (1-p) o

Schermata 2013-12-27 alle 18.29.37

come affermato sopra.

 

 

E’ facile vedere che questo modo di misurare la convinzione, fornisce risultati in accordo con i concetti ordinari; comunque per estensione la piena convinzione è indicata con 1, piena convinzione in negativo con 0, e pari convinzione tra due con 1/2. Inoltre, ammette la validità della scommessa come mezzo per misurare le convinzioni. Proponendo una scommessa su p diamo al soggetto una possibile condotta di azione da cui risulterebbe tanto supplementare bene per lui se p fosse vero e tanto maggiore male se p è falso. Supponendo la scommessa fosse tra bene e male invece che in denaro, egli scommetterebbe per qualsiasi migliore probabilità di quella che corrisponde al suo stato di convinzione; in realtà il suo stato di convinzione è misurato dalla probabilità che egli precisamente assumerà; ma questo è viziato, come già spiegato, per amore o odio di emozione, e per il fatto che la scommessa è in denaro e non in bene e male. Poiché è universalmente riconosciuto che il denaro ha un’utilità marginale decrescente, se si considerano le scommesse in denaro, è evidente che esse devono essere per quanto possibile di piccola posta. Ma poi di nuovo la misura è guastata introducendo il nuovo fattore di riluttanza a preoccuparsi per inezie.

Vediamo ora di scartare l’ipotesi che il bene sia additivo e immediatamente misurabile, e cerchiamo di elaborare un sistema con meno ipotesi possibili. Per cominciare supponiamo, come prima, che il nostro soggetto ha certe convinzioni su tutto; poi egli agirà in modo che ciò che crede essere le conseguenze complessive della sua azione siano le migliore possibili. Se poi avessimo il potere  dell’Onnipotente, e potessimo convincere il nostro soggetto del nostro potere, potremmo, offrendogli opzioni, scoprire come ha posto in ordine di merito tutti i possibili andamenti del mondo. In questo modo tutti i mondi possibili verrebbero posti in ordine di valore, ma non avremmo un modo esatto di rappresentarli con i numeri. Non avrebbe alcun significato l’affermazione che la differenza di valore tra α e β sia pari a quella tra γ e δ. [Qui e altrove usiamo lettere greche per rappresentare le diverse possibili totalità di eventi tra cui il nostro soggetto sceglie – le definitive organiche unità.]

Supponiamo ora che il soggetto sia in grado di dubitare; allora potremmo provare il suo grado di convinzione in diverse proposizioni facendogli offerte del tipo seguente. Preferiresti avere un mondo α in qualsiasi evento; o un mondo β se p è vero, e un mondo γ se p è falsa? Se, allora, egli fosse certo che che p fosse vero, egli semplicemente confronterebbe α e β e sceglierebbe tra questi come se non ci fossero condizioni fissate; ma se dubitasse della sua scelta non potrebbe decidere in modo così semplice. Propongo di stabilire assiomi e definizioni in merito ai principi che regolano scelte di questo tipo. Questo è, naturalmente, una versione molto schematica della situazione nella vita reale, ma è, credo, più facile da prendere in considerazione in questa forma.

Vi è innanzitutto una difficoltà che deve essere affrontata; le proposizioni p, come nel caso di cui sopra che vengono utilizzate come condizioni nelle varianti offerte possono essere tali che la loro verità o falsità è un oggetto del desiderio per il soggetto. Questo scoprirà che complica il problema, e noi dovremo assumere che ci sono proposizioni per le quali questo non è il caso, che noi chiameremo eticamente neutrali. Più precisamente una proposizione atomica p è detta eticamente neutrale se due mondi possibili che differiscono solo in relazione alla verità di p sono sempre di pari valore; e una proposizione non-atomica p è detta eticamente neutrale se tutti suoi argomenti veri 1 sono eticamente neutrali. 1 Assumo qui la teoria delle proposizioni di Wittgenstein; può essere possibile dare una definizione equivalente nei termini di qualsiasi altra teoria.

Cominciamo con la definizione del grado di convinzione 1/2 in una proposizione eticamente neutrale. Si dice che il soggetto ha un grado di convinzione 1/2 in una certa proposizione p se non ha preferenze tra le opzioni (1), α se p è vero, β se p è falsa, e (2) α se p è falsa, β se p è vera, ma ha semplicemente una preferenza tra α e β. Supponiamo per un assioma che se questo è vero per qualche coppia α, β è vero per tutte le coppie tali. 1 Ciò risulta rozzamente definendo il grado di convinzione 1/2 come quel grado di convinzione che porta all’indifferenza fra lo scommettere in un modo e scommettere nell’altro per la stessa puntata.

Il grado di convinzione 1/2 così definito può essere usato per misurare i valori numericamente nel modo seguente. Dobbiamo spiegare cosa si intende per la differenza di valore tra α e β essere uguale a quello tra γ e δ; e definiamo questo per indicare che, se p è una proposizione eticamente neutrale creduta con il grado 1/2, il soggetto non ha alcuna preferenza tra le opzioni (1) α se p è vera, δ se p è falsa, e (2) β se p è vera, γ se p è falsa.

Questa definizione può costituire la base di un sistema di misurazione dei valori nel modo seguente: –

Chiamiamo qualsiasi insieme di tutti i mondi ugualmente preferibile a un mondo dato un valore: supponiamo che, se il mondo α è preferibile a β qualsiasi mondo con lo stesso valore di α è preferibile a qualsiasi mondo con lo stesso valore di β e possiamo dire che il valore di α è maggiore di quella di β. Questa relazione ‘maggiore di’ ordina i valori in una serie. Useremo α d’ora in poi sia per il mondo sia per suo valore.

Assiomi.

(1) Vi è una proposizione p eticamente neutrale creduta con grado 1/2.

(2) Se p, q sono proposizioni cosiffatte anche l’opzione

α se p, δ se non-p è equivalente a β se p, γ se non-p

allora α se q, δ se non-q è equivalente a β se q, γ se non-q.

Definizione Nel caso di cui sopra si dice αβ = γδ.

Teoremi.  Se αβ=γδ

allora βα=δγ, αγ=βδ, γα=δβ

1 α e β si suppongono così indefinite da essere compatibili sia con p sia con non-p.

(2a) Se αβ = γδ, allora α> β è equivalente a γ> δ

e α = β è equivalente a γ = δ

(3) Se l’opzione A è equivalente all’opzione B e B a C, allora A è equivalente a C.

Teorema. Se αβ = γδ e βη = ζγ

allora  αη = ζδ

(4) Se αβ = γδ, γδ = ηζ, allora  αβ = ηζ.

(5) (α, β, γ). E ! (ικ) (ακ = βγ)

(6) (α, β). E ! (ικ) (ακ = κβ)

(7) Assioma di continuità: – Qualsiasi progressione ha un limite (ordinale).

(8) Assioma di Archimede.

Questi assiomi consentono ai valori di essere correlati biunivocamente con numeri reali in modo che se α1 corrisponde a α, ecc

αβ = γδ . ≣ . α1 – β1 = γ1 – δ1.

D’ora in poi useremo α anche per il correlato numero reale α1.

Avendo così definito un metodo di misurazione del valore possiamo ricavare un modo per misurare la convinzione in generale. Se l’opzione di α certa è indifferente con quella di β, se p è vero e γ se p è falso 1, possiamo definire il grado di convinzione del soggetto in p come il rapporto della differenza tra α e γ sulla differenza tra β e γ; che si deve supporre uguale per tutte le α, β e γ che soddisfano le condizioni. Questo valore grossolanamente per definire il grado di convinzione in p per la probabilità per cui il soggetto scommetterebbe su p, essendo la scommessa gestita nei termini di differenza di valori come definiti. La definizione si applica solo alla convinzione parziale e non include certe convinzioni; perché la convinzione di grado 1 in p, α per certo è indifferente rispetto ad α se p e per ogni β  se non-p.

Qui β deve comprendere la verità di p, γ la sua falsità; p non deve più essere eticamente neutrale. Ma dobbiamo assumere che esiste un mondo con qualsiasi valore assegnato in cui p è vero, e uno in cui p è falso.

Siamo anche in grado di definire una nuova idea molto utile – il ‘grado di convinzione in p dato q’. Questo non significa il grado di convinzione in ‘Se p allora q’, o quello in ‘p implica q’, o quella che il soggetto avrebbe in p se conoscesse q, o quella che dovrebbe avere. Esprime approssimativamente le probabilità per cui egli scommetterebbe ora su p, la scommessa sarebbe valida solo se q fosse vero. Tali scommesse condizionali venivano spesso fatte nel XVIII secolo.

Il grado di convinzione in p dato q si misura così. Supponiamo che un soggetto indifferente tra le opzioni (1) α se q vero, β se q falsa, (2) γ se p vera e q vero, δ se p falsa e q vero, β se q falso. Allora il suo grado di convinzione in p dato q è il rapporto delle differenza tra α e δ sulla differenza tra γ e δ, che dobbiamo supporre le stesse per qualsiasi, α, β, γ, δ che soddisfino le condizioni date. Questa non è la stessa cosa del grado con cui potrebbe credere in p, se credesse certo q; perché la conoscenza di q potrebbe per ragioni psicologiche alterare completamente il suo intero sistema di convincimento.

Ognuna delle nostre definizioni è stata accompagnata da un assioma di coerenza, e nella misura in cui ciò è falso, la nozione di grado di convinzione diviene non più valido. Questo ha una certa analogia con la situazione in materia di simultaneità discussa sopra.

Non ho sviluppato la logica matematica di questo nel dettaglio, perché questo, credo, sarebbe come avere un risultato con sette decimali che è valido con due soli decimali. La mia logica non può essere considerata come in grado di dare più di un di un certo tipo di procedimento che potrebbe funzionare.

Da queste definizioni e assiomi è possibile provare le leggi fondamentali della convinzione probabile (i gradi di convinzione sono compresi tra 0 e 1):

(1) Grado di convinzione in grado p + di convinzione in  Schermata 2013-11-24 alle 21.04.13    = 1

(2) Grado di convinzione in p  dato q + grado di convinzione in  Schermata 2013-11-24 alle 21.04.13  dato q = 1.

(3) Grado di credere in (p e q) = grado di convinzione in p x grado di convinzione in q dato p.

(4) Grado di convinzione in (p e q) + grado di convinzione in (p e Schermata 2013-08-23 alle 22.32.01   ) = grado di convinzione in p.

Le prime due sono di immediata comprensione. La (3) si dimostra come segue.

Sia il grado di convinzione in p = x, quello in q dato p = y.

Allora ξ certo ≣ ξ + (1-x) t se p vero, ξ – xt se p falso per qualsiasi t.

ξ + (1 – x) t se p vero ≣

ξ + (1 – x) + t (1 – y) u se ‘p e q’ veri,

ξ + (1 – x) t – yu se p vero e q falso;  per ogni u

Scegliamo u in modo che ξ + (1 – x) t – yu = ξ – xt,

cioè sia u = t / y (y ≠ 0)

Allora ξ certo ≣

ξ+ (1 – x)t + t (1 – y) t / y se p e q veri,

ξ – xt altrimenti.

∴ il grado di convinzione in ‘p e q’ =  Schermata 2013-12-28 alle 09.25.12        = xy. (t≠0)

Se y = 0, comporta t = 0.

Allora ξ certo ≣ ξ se p vero, ξ se p falso

≣ ξ + u se p vero, q vero;  ξ se p falso, q falso; ξ se p falso

≣ ξ+u, pq vero;  ξ, pq falsa

∴ grado di convinzione in pq = 0.

(4) segue da (2), (3) come segue: –

Grado di convinzione in pq = p x  quello in q dato p, dalla (3).

Allo stesso modo il grado di convinzione in p Schermata 2013-08-23 alle 22.32.01    = quello in p x quello in Schermata 2013-08-23 alle 22.32.01     dato p

∴ la  somma = grado di convinzione in p, per la (2).

Queste sono le leggi della probabilità, che abbiamo dimostrato di essere necessariamente vere per ogni insieme coerente di gradi di convinzione. Qualsiasi insieme definito di gradi di convinzione che le infrange sarebbe incoerente nel senso che ha violato le leggi di preferenza tra le opzioni, come quella che la preferenza è una relazione asimmetrica transitiva, e che se α è preferibile a β, β di certo non può essere preferibile ad α se p, β se non-p. Se la condizione mentale di chiunque viola queste leggi, la sua scelta dipenderebbe dalla forma precisa cui le opzioni gli sono state offerte, il che sarebbe assurdo. Potrebbe assumere una scommessa fatta contro di lui con la migliore astuzia e restare a perdere in ogni caso.

Troviamo, quindi, che un calcolo preciso della natura della convinzione parziale rivela che le leggi della probabilità sono leggi di coerenza, un’estensione alle convinzioni parziali della logica formale, la logica della coerenza. Esse non dipendono per il loro significato da qualsiasi grado di convinzione in una proposizione che risulti essere univocamente determinata come una proposizione razionale: ma semplicemente distinguono gli insiemi di convinzioni che vi obbediscono come quelle coerenti. Avere un qualsiasi grado definito di convinzione implica un certo grado di coerenza, vale a dire la volontà di scommettere su una proposizione data con la stessa probabilità per ogni puntata, essendo la puntata misurata in termini di valori massimi.

Avere gradi di convinzione che obbediscono alle leggi della probabilità implica un’ulteriore misura di coerenza, vale a dire una tale coerenza tra le probabilità accettabili su diverse proposizioni da impedire a una scommessa fatta contro di voi.

Alcune considerazioni conclusive su questa sezione non sarebbero fuori luogo. In primo luogo, queste considerazioni si basano fondamentalmente sulle scommesse, ma questo non sembra irragionevole quando si si sia considerato che in tutta la nostra vite stiamo un certo senso scommettendo. Ogni volta che andiamo alla stazione stiamo scommettendo che un treno effettivamente camminerà, e se non avessimo un sufficiente grado di fiducia in questo rifiuteremmo la scommessa e rimarremmo a casa. Le opzioni che Dio ci da’ sono sempre subordinate al nostro indovinare se una certa proposizione è vera. In secondo luogo, si basa tutto sul concetto di speranza matematica; l’insoddisfazione spesso sentita con questa idea è dovuta principalmente alla misura imprecisa del bene. Chiaramente le aspettative matematiche in termini di denaro non sono adatte guide per il comportamento. Va ricordato, nel giudicare il mio sistema, che in esso un valore viene effettivamente definito mediante la speranza matematica in caso di convinzione di grado 1/2, e così possiamo attenderci che possa essere rappresentato adeguatamente in una scala per una utile applicazione della speranza matematica nel caso di altri gradi di convinzione.

In terzo luogo, nulla è stato detto sui gradi di convinzione quando il numero di alternative è infinito. A proposito di questo non ho niente di utile da dire, tranne che dubito che la mente sia capace di contemplare più di un numero finito di alternative. Si possono prendere in considerazione domande alle quali sia possibile un numero infinito di risposte, ma al fine di esaminare le risposte si devono riunire in un numero finito di gruppi. La difficoltà diventa praticamente rilevante quando si parla di induzione, ma anche allora mi sembra non ci sia necessità di introdurla. Possiamo discutere se l’esperienza passata fornisce un elevata probabilità al levarsi del sole domani senza preoccuparsi di quale probabilità ciò dia al sole di alzarsi ogni mattina per sempre. Per questo motivo non posso ma non intendo che la discussione del problema 1 di Ritchie sia insoddisfacente; è vero che possiamo convenire che le generalizzazioni per induzione  non richiedono nessuna probabilità finita, ma aspettative particolari intrattenute su basi induttive senza dubbio hanno una elevata probabilità numerica nelle menti di tutti noi. Siamo tutti più certi che il sole sorgerà  domani che non avrò 12 con due dadi al primo tiro, ovvero abbiamo una convinzione di grado più elevato di 35/36 in quel caso. Se mai l’induzione richiedesse una giustificazione logica  questa è in rapporto con la probabilità di un evento come questo.

1 A.D. Ritchie, “Induction and Probability”. Mind, 1926. p. 318. ‘La conclusione della discussione precedente può essere messa in modo semplice. Se il problema dell’induzione fosse posto come “Come le generalizzazioni induttive possono acquisire una grande probabilità numerica? ” allora questo è uno pseudo-problema, perché la risposta è “non possono”. Questa risposta, tuttavia,  non è una negazione della validità dell’induzione, ma è una diretta conseguenza della natura della probabilità. Lascia ancora intatto il vero problema dell’induzione che è “Come può essere aumentata la probabilità di una induzione? ” e lascia in piedi l’intera discussione di Keynes su questo punto.’

(4) LA LOGICA DELLA COERENZA

Possiamo essere d’accordo che in un certo senso sia compito della logica di dirci che cosa dobbiamo pensare; ma l’interpretazione di questa affermazione solleva notevoli difficoltà. Si può dire che dobbiamo pensare ciò che è vero, ma in questo senso ci viene detto cosa pensare da tutta la scienza e non semplicemente dalla logica. Né, in questo senso, può essere basata alcuna giustificazione per la convinzione parziale; la cosa migliore idealmente è che avremmo convinzioni di grado 1 in tutte le proposizioni vere e convinzioni di grado 0 in tutte le proposizioni false. Ma questo è un criterio troppo elevato da attendersi da uomini mortali, e dobbiamo convenire che alcuni gradi di dubbio o di errore possono essere umanamente giustificati.

Molti logici, suppongo, accetterebbero come valutazione della loro scienza le parole di apertura di Keynes nel ‘Treatise on Probability’: “parte della nostra conoscenza si ottiene direttamente, e in parte dalla ragione. La teoria della probabilità si occupa della parte che si ottiene con il ragionamento, e tratta dei diversi gradi in cui i risultati così ottenuti sono inoppugnabili o non inoppugnabili. ” Dove Keynes dice: ‘La teoria della probabilità’, altri direbbero la Logica. Si ritiene, vale a dire, che le nostre opinioni possono essere divise in quelle che possediamo immediatamente come risultato della percezione o della memoria, e quelle che ci derivano dal passato per ragionamento. E’ compito della Logica di accettare quanto viene dalla classe del passato e criticare solo la derivazione di una seconda classe da questa.

La logica come scienza del ragionamento e di inferenza è tradizionalmente e giustamente suddivisa in deduttiva e induttiva; ma la differenza e la relazione tra queste due divisioni del soggetto possono essere concepite in modi estremamente diversi. Secondo Keynes i ragionamenti deduttivi e induttivi validi sono fondamentalmente simili; entrambi sono giustificati da relazioni logiche tra premessa e conclusione che differiscono solo nel grado. Non posso accettare questa posizione, come ho già spiegato. Io non vedo cosa queste relazioni logiche inconclusive possano essere o come possano giustificare convinzioni parziali. Nel caso di ragionamenti logici inoppugnabili posso accettare la ragione della loro validità che è stata data da molte autorità, e la stessa si può trovare sostanzialmente in Kant, De Morgan, Peirce e Wittgenstein. Tutti questi autori concordano sul fatto che la conclusione di un argomento formalmente valido è contenuta nelle sue premesse; che negare la conclusione pur accettando le premesse sarebbe auto-contraddittorio; che la deduzione formale non aumenta la nostra conoscenza, ma mette in evidenza chiaramente ciò che già conosciamo in un’altra forma; e che siamo obbligati ad accettare la sua validità a meno di accettare l’incoerenza con noi stessi. La relazione logica che giustifica l’inferenza è che il senso o il valore della conclusione è contenuto in quello delle premesse.

Ma nel caso di un ragionamento induttivo questo non avviene affatto; è impossibile rappresentarlo come se somigliasse ad un ragionamento deduttivo semplicemente di grado più debole; è assurdo dire che il senso della conclusione è parzialmente contenuto in quello delle premesse. Potremmo accettare le premesse e assolutamente respingere la conclusione, senza alcun tipo di incoerenza o contraddizione. Mi sembra, quindi, che possiamo dividere i ragionamenti in due tipi radicalmente differenti, che noi possiamo riconoscere nelle parole di Peirce come (1) ‘esplicativi, analitici, o deduttivi’ e (2) ‘amplificativi, sintetici, oppure (in senso lato) Induttivi’.1 I ragionamenti del secondo tipo sono da un importante punto di vista molto più vicini ai ricordi e alle percezioni rispetto ai ragionamenti deduttivi. Possiamo considerare la percezione, la memoria e l’induzione come tre fondamentali mezzi per acquisire la conoscenza; la deduzione invece è soltanto un metodo di organizzare la nostra conoscenza e di eliminare incongruenze o contraddizioni.

La logica deve quindi rientrare decisamente in due parti: (escludendo la logica analitica, la teoria dei termini e delle proposizioni) abbiamo la logica minore, che è la logica della coerenza, o logica formale, e la logica maggiore, che è la logica della scoperta, o la logica induttiva.

Quello che abbiamo ora da osservare è che questa distinzione in alcun modo coincide con la distinzione tra certezza e convinzioni parziali; abbiamo visto che esiste una teoria della coerenza nella convinzione parziale non meno della coerenza nella convinzione certe, sebbene per vari motivi la prima non è così importante come la seconda. La teoria della probabilità è in realtà una generalizzazione della logica formale; ma nel processo di generalizzazione uno degli aspetti più importanti della logica formale è demolito.  Se p e  Schermata 2013-08-23 alle 22.32.01       non sono coerenti in modo che q segue logicamente da p, che p implica q è ciò che è chiamato da Wittgenstein una ‘tautologia’ e può essere considerato come un caso degenere di una proposizione vera che non comporti il concetto di coerenza. Questo ci permette di considerare (non del tutto correttamente) la logica formale inclusa la matematica come una scienza oggettiva costituita da proposizioni necessariamente oggettive. Questo ci fornisce non soltanto la ἀνάγκη λέγειν, che se noi affermiamo p siamo costretti dalla coerenza affermare anche q, ma anche l’ ἀνάγκη εἶναι, che se p è vero, così deve essere q. Ma quando estendiamo la logica formale per includere le convinzioni parziali tale interpretazione oggettiva esplicita è perduta;  se crediamo pq nella misura di 1/3 e p  Schermata 2013-08-23 alle 22.32.01   nella misura di 1/3 siamo costretti per coerenza a credere anche  Schermata 2013-11-24 alle 21.04.13     nella misura di 1/3.  Questo è ἀνάγκη λέγειν, ma non possiamo dire che se pq è vero per 1/3 e p Schermata 2013-08-23 alle 22.32.01     vero per 1/3, anche Schermata 2013-11-24 alle 21.04.13  deve essere vero per 1/3, perché questa asserzione sarebbe puro non senso. Lì non ci sarebbe corrispondenza ἀνάγκη εἶναι. Quindi, a differenza del calcolo di coerenza della convinzione piena, il calcolo dell’oggettiva parziale convinzione non può essere immediatamente interpretato come un corpo di oggettiva tautologia.

Questo è però possibile in modo indiretto; abbiamo visto all’inizio di questo saggio che il calcolo delle probabilità potrebbe essere interpretato in termini di rapporti di classi; ora abbiamo scoperto che può anche essere interpretato come un calcolo di coerente convinzione parziale. E’ naturale, quindi, che dovremmo aspettarci una qualche intima connessione tra queste due interpretazioni, una spiegazione della possibilità di applicare lo stesso calcolo matematico a due insiemi diversi di tali fenomeni. Nè c’è una spiegazione difficile da trovare, ci sono molte connessioni tra convinzioni parziali e frequenze. Per esempio, le frequenze sperimentate spesso portano a corrispondenti convinzioni parziali, e convinzioni parziali portano all’aspettativa di frequenze corrispondenti in accordo al teorema di Bernoulli. Ma nessuna di queste è esattamente la correlazione che vorremmo; una convinzione parziale non può in generale essere collegata univocamente con qualsiasi frequenza effettiva, perché la correlazione viene sempre realizzata prendendo la proposizione in questione come un caso di una funzione proposizionale. Quale funzione proposizionale abbiamo scelto è in qualche misura arbitraria e la frequenza corrispondente varierà notevolmente con la nostra scelta. Le pretese di alcuni esponenti della teoria della frequenza che la convinzione parziale significa piena convinzione in una proposizione sulla frequenza non può essere sostenuta.

1 C.S. Peirce Chance Love and Logic, p.92

Ma abbiamo scoperto che l’idea stessa della convinzione parziale comporta il riferimento ad una ipotetica o ideale frequenza; supponendo che il bene abbia la proprietà additiva, credere con il grado m/n è un tipo di convinzione che conduce alla azione che vorremmo fosse la migliore se ripetuta n volte in m delle quali la proposizione sia vera; o potremmo dire più brevemente che questo è il tipo di convinzione più appropriata ad un certo numero di occasioni ipotetiche altrimenti identiche nella proporzione m/n per cui la proposizione in questione è vera. E’ questa correlazione tra convinzione parziale e frequenza che ci permette di utilizzare il calcolo delle frequenze, come un calcolo di coerente convinzione parziale. E in un certo senso possiamo dire che le due interpretazioni sono gli aspetti oggettivi e soggettivi dello stesso significato recondito, così come la logica formale può essere interpretata oggettivamente come un corpo di tautologie e soggettivamente come le leggi del pensiero coerente.

Noi, credo, scopriremo che questo punto di vista del calcolo delle probabilità rimuove varie difficoltà che finora sono stati trovate sconcertanti. In primo luogo ci fornisce una evidente giustificazione degli assiomi di calcolo, che in un sistema come quello di Keynes è totalmente mancante. Perché ora si vede facilmente che se le convinzioni parziali sono coerenti obbediranno a questi assiomi, ma è assolutamente oscuro perché le misteriose relazioni logiche di Keynes dovrebbero obbedire a questi assiomi. 1 Dovremmo essere così stranamente ignoranti degli esempi di queste relazioni, e così stranamente perspicaci circa le loro leggi generali.

In secondo luogo, possiamo fare a meno del Principio di Indifferenza; noi non lo consideriamo appartenente alla logica formale nel dire che sarebbe una previsione di una persona l’estrarre una palla bianca o nera da un’urna; le sue aspettative iniziali potrebbero essere entro i limiti della coerenza qualcosa che egli preferisce; tutto quello che dobbiamo sottolineare è che se ha certe aspettative egli è tenuto per coerenza ad averne certe altre. Questo è semplicemente prendere la probabilità sullo stesso piano della normale logica formale, che non critica le premesse, ma dichiara semplicemente che alcune conclusioni sono le sole coerenti con esse. Essere in grado portare fuori dalla logica formale il Principio di Indifferenza è un grande vantaggio; perché è abbastanza evidentemente impossibile stabilire condizioni puramente logiche per la sua validità, come viene tentato da Keynes. Non voglio discutere la questione in dettaglio, perché porta alla pedanteria e a distinzioni arbitrarie che potrebbero essere discusse per sempre. Ma chi cerca di decidere con i metodi di Keynes quali siano le alternative adeguate a considerare l’equiprobabile nella meccanica delle molecole, ad esempio in Gibbs nello spazio-fase, sarà presto convinto che sia una questione di fisica piuttosto che di logica pura. Usando la formula di moltiplicazione, come viene usato nella probabilità inversa, possiamo in base alla teoria di Keynes ridurre tutte le probabilità a quozienti di probabilità a priori; ed è quindi con riguardo a questi ultimi che il principio di indifferenza è di primaria importanza, ma qui il problema non è ovviamente un problema di logica formale. Come possiamo semplicemente su basi logiche suddividere lo spettro in bande equiprobabili?

Nel sistema di Keynes appare come se gli assiomi principali – le leggi di addizione e moltiplicazione – non siano altro che definizioni. Si tratta semplicemente di un errore logico; le sue definizioni sono formalmente errate, a meno che vengano assunti i corrispondenti assiomi. Così la sua definizione di moltiplicazione presuppone la legge che se la probabilità di a dato bh è uguale a quella di c dato dh, e la probabilità di b dato h è uguale a quella di d dato k, allora la probabilità di ab dato h e di cd dato k saranno uguali.

Una terza difficoltà che viene eliminata dalla nostra teoria è quella che è presente nella teoria di Keynes nel caso seguente. Credo di percepire o ricordare qualcosa ma non sono sicuro; questo sembrerebbe darmi qualche motivo di credere, contrariamente alla teoria di Keynes,per cui il grado di convinzione che dovrei avere essendo razionale per me  è quello dato dal rapporto di probabilità tra la proposizione in questione e le cose che so per certe. Egli non può giustificare una probabile convinzione fondata non su ragionamenti ma su diretta sperimentazione. A nostro avviso non ci sarebbe niente di contrario alla logica formale, in una tale convinzione; se questo sia ragionevole dipenderà da quello che ho chiamato la grande logica che sarà il soggetto del prossimo capitolo; vedremo che non c’è nessuna obiezione a tale possibilità, con la quale il metodo di Keynes di giustificare la probabile convinzione esclusivamente attraverso relazione di conoscenza certa non è assolutamente in grado di sostenere.

(5) LA LOGICA DELLA VERITÁ

La validità della distinzione tra la logica di coerenza e la logica della verità è stata spesso contestata; è stato sostenuto da un lato che la coerenza logica è solo una specie di coerenza basata sui fatti; che se la convinzione in p non è coerente con una in q, significa semplicemente che p e q non sono entrambe vere, e che questo è un fatto necessario o fatto logico. Personalmente, ritengo che questa difficoltà può essere soddisfatta dalla teoria di Wittgenstein sulla tautologia, secondo la quale se una convinzione in p è incompatibile con quella di q che p e q non sono entrambe vere non è un fatto, ma una tautologia. Ma io non mi propongo di discutere di questo problema ulteriormente qui.

Dall’altra parte si sostiene che la logica formale o la logica di coerenza sia  l’insieme della logica e la logica induttiva  sia o un nonsenso o una parte delle scienze naturali. Questa asserzione, che suppongo che sia stata fatta da da Wittgenstein, sento più difficile da controbattere. Ma io credo che sarebbe un peccato, a causa del rispetto verso l’autorità, rinunciare a provare a dire qualcosa di utile sull’induzione.

Dobbiamo quindi tornare indietro alla concezione generale della logica come scienza del pensiero razionale. Noi troviamo che le parti più generalmente accettate della logica, vale a dire, la logica formale, la matematica e il calcolo delle probabilità, riguardano tutte semplicemente il garantire che le nostre convinzioni non siano auto-contraddittorie. Abbiamo posto davanti a noi stessi i criteri di coerenza e costruito queste elaborate regole per garantirne l’osservanza. Ma ovviamente questo non basta; vogliamo che le nostre convinzioni siano coerenti non solo l’una con l’altra ma anche con i fatti 1: né è ancora chiaro che la coerenza sia sempre vantaggiosa; ma potrebbe essere meglio essere a volte nel giusto che mai nel giusto. Né quando vogliamo essere coerenti siamo sempre in grado di esserlo: ci sono proposizioni matematiche la cui verità o falsità non può ancora essere decisa. Eppure si può umanamente parlando di avere diritto di prendere in considerazione un certo grado di convinzione in quelle per motivi induttivi o su altre basi: una logica che si propone di giustificare un tale grado di convinzione deve essere disposta in realtà  ad andare contro la logica formale; perché a una verità formale logica si può assegnare solo una convinzione di grado 1. Si potrebbe dimostrare nel sistema di Keynes che la sua probabilità è pari a 1 in qualsiasi prova. Questo punto mi sembra di dimostrare in modo particolarmente evidente che la logica umana o la logica della verità, che dice agli uomini come dovrebbero pensare, non è solo indipendente, ma a volte in realtà incompatibile con la logica formale.

1 Cfr.. Kant: ‘Denn obgleich eine Erkenntnis der logischen Form völlig gemäss sein möchte, dass ist sich selbst nicht widerspräche, so kann sie doch noch immer dem Gegenstande widersprechen.’ Kritik der reinen Vernunft, ‘, Prima Edizione p. 59. Infatti, sebbene la conoscenza della forma logica sia del tutto coerente cioè non contraria a sé, può tuttavia essere in disaccordo con l’oggetto ‘. Critica della ragion pura.

Nonostante questo quasi tutto il pensiero filosofico sulla logica umana e in particolare sull’induzione ha cercato di ridurlo in qualche modo alla logica formale. Non si suppone questo, se non da pochissimi, che la coerenza da sé stessa conduca alla verità; ma che alla coerenza con l’osservazione e la memoria spesso è attribuito questo potere.

Dal momento che un’osservazione ha cambiato (almeno in grado) la mia opinione sul fatto osservato, alcuni dei miei gradi di convinzione dopo l’osservazione sono necessariamente non coerenti con quelli che avevo prima. Dobbiamo quindi spiegare come esattamente l’osservazione potrebbe modificare i miei gradi di convinzione; ovviamente se p è il fatto osservato, il mio grado di convinzione in q dopo l’osservazione dovrebbe essere uguale al mio grado di convinzione in q dato p di prima, o dalla legge di moltiplicazione, al quoziente del mio grado di convinzione in pq per il mio grado di convinzione in p . Quando i miei gradi di convinzione cambiano in questo modo possiamo dire che essi sono stati modificati coerentemente con la mia osservazione.

Usando questa definizione, o nel sistema di Keynes semplicemente utilizzando la legge di moltiplicazione, possiamo prendere i miei attuali gradi di convinzione, e considerando la totalità delle mie osservazioni, scoprire da quali gradi iniziali di convinzione i miei attuali gradi di convinzione sarebbero sorti da questo processo di coerente modifica. I miei livelli attuali di convinzione possono quindi essere considerati logicamente giustificati se i corrispondenti gradi iniziali di convinzione sono logicamente giustificati. Ma il chiedere quali gradi iniziali di convinzione siamo giustificati, o nel sistema di Keynes quali sono le probabilità assolute a priori, mi sembra un problema senza senso; e anche se avesse un significato non vedo come potrebbe essere risolto.

Se abbiamo effettivamente applicato questo processo per un essere umano, scoperto, vale a dire, su quali probabilità a priori le sue opinioni attuali dovrebbero essere basate, dovremmo ovviamente trovarle tra quelle determinate da selezione naturale, con una generale tendenza a dare una maggiore probabilità alle alternative più semplici. Ma, come ho detto , non riesco a vedere quale potrebbe essere lo scopo di chiedersi se questi gradi di convinzione siano logicamente giustificati.

Ovviamente la cosa migliore sarebbe quella di sapere con certezza in anticipo che cosa sia vero e cosa falso, e quindi se un qualsiasi sistema di convinzioni iniziali dovesse ricevere l’approvazione del filosofo dovrebbe essere questo. Ma evidentemente questo non sarebbe accettato dai pensatori della scuola che sto criticando. Un’altra alternativa è quella di ripartire le probabilità iniziali sul sistema puramente formale esposto da Wittgenstein, ma come questo non fornisce alcuna giustificazione per l’induzione non può darci la logica umana che stiamo cercando.

Dobbiamo quindi cercare di avere un’idea di una logica umana che non deve tentare di essere riducibile alla logica formale. La logica, possiamo essere d’accordo, non riguarda ciò che gli uomini credono davvero, ma quello che dovrebbero credere, o quello che sarebbe ragionevole credere. Cosa significa allora, dobbiamo chiederci, dire che è ragionevole per un uomo avere questo o quel grado di convinzione in una proposizione? Prendiamo in considerazione le possibili alternative.

In primo luogo, questo significa a volte qualcosa di spiegabile in termini di logica formale: possiamo abbandonare questa possibilità per i motivi già spiegati. In secondo luogo, a volte significa semplicemente che essendo io al suo posto (e non ad esempio ubriaco) avrei avuto un tale grado di convinzione. In terzo luogo, a volte significa che se la sua mente lavora secondo certe regole, che possiamo approssimativamente chiamare ‘metodo scientifico’, avrebbe avuto un tale grado di convinzione. Ma in quarto luogo non è necessario sostenere nessuna di queste cose; perché gli uomini non hanno sempre creduto nel metodo scientifico, e proprio come noi domandiamo’ Ma io sono necessariamente ragionevole‘, possiamo anche chiedere ‘Ma è lo scienziato necessariamente ragionevole?’ In quest’ultimo significato mi sembra che possiamo identificare una ragionevole opinione con l’opinione di una persona ideale in circostanze analoghe. Quale, invece, sarebbe l’opinione di questa persona ideale ? Come è stato già osservato, il più alto ideale sarebbe sempre che avrebbe una opinione vera e sarebbe certo di ciò; ma questo ideale è più adatto a Dio che all’uomo.1

Dobbiamo dunque considerare la mente umana e ciò che è il massimo che possiamo chiedere ad essa. 2 La mente umana lavora essenzialmente in base a regole generali o abitudini; un processo mentale che non procede secondo qualche regola sarebbe semplicemente una sequenza casuale di idee; ogni volta che si deduce A da B lo facciamo in virtù di una qualche relazione tra di loro. Possiamo quindi affermare il problema dell’ideale come ” Quali abitudini in senso generale sarebbero le migliori che avesse la mente umana? ” Questo è un grande e indeterminato problema che difficilmente potrebbe essere risolto a meno che le possibilità fossero dapprima state limitate da una concezione abbastanza precisa della natura umana. Potremmo immaginare alcune abitudini molto utili diverse da quelle possedute da tutti gli uomini. [ Va precisato che io uso l’abitudine con il significato più ampio possibile per significare semplicemente regola o legge di comportamento, tra cui l’istinto: non voglio distinguere regole o abitudini acquisiti in senso stretto dalle regole innate o istinti, ma mi propongo di chiamarle tutte ugualmente abitudini.] Una analisi del tutto generale della mente umana è quindi destinata ad essere vaga e futile, ma qualcosa di utile si può dire se limitiamo l’argomento nel modo seguente.

Supponiamo di avere l’abitudine di formare un’opinione in un certo modo; ad esempio l’abitudine di derivare dall’opinione che un fungo è giallo l’opinione che sia velenoso. Allora possiamo accettare il fatto che la persona ha un’abitudine di questo genere, e chiedere semplicemente quale grado di parere che il fungo è velenoso sarebbe meglio per lui prendere in considerazione quando lo vede; cioè ammettendo che pensa sempre nello stesso modo su tutti i funghi gialli, possiamo chiedere quale sia il grado di fiducia migliore che lui dovrebbe avere che quei funghi siano velenosi. E la risposta è che sarà in generale migliore per il suo grado di convinzione che un fungo giallo è velenoso sia pari alla quota di funghi gialli che sono in realtà velenosi. (Ciò deriva dal significato del grado di convinzione.) Questa conclusione è necessariamente vaga per quanto riguarda l’area spazio-temporale dei funghi, che include, ma difficilmente più vaga della domanda a cui risponde. (Cfr. densità in un punto di gas composto da molecole.)

1[ Una precedente stesura della materia del paragrafo in qualche modo migliore. – F.P.R. Che cosa si intende dicendo che un certo grado di convinzione è ragionevole ? Primo e spesso che è quello che prenderei in considerazione se avessi i pareri della persona in questione al momento, ma erano diversi da come sono adesso, ad esempio, non ubriachi. Ma a volte andiamo oltre e chiediamo: ‘ Sono ragionevole?’ Questo può significare, mi comporto conformemente a determinate norme, enumerabili che noi chiamiamo metodo scientifico, e che stimiamo a causa del valore di chi lo pratica ed il successo che raggiunge. In questo senso essere ragionevoli significa pensare come uno scienziato, o essere guidato solo da raziocinio e induzione o qualcosa del genere (vale a dire mezzi ragionevoli di riflessione). In terzo luogo, possiamo andare alla radice del perché ammiriamo lo scienziato e analizziamo non un parere particolare primario, ma un abitudine mentale che conduce o meno alla scoperta della verità o prende in considerazione quei gradi di convinzione che sarebbero più utili. (Per includere le abitudini al dubbio o alla convinzione parziale). Allora possiamo considerare un parere secondo l’ abitudine che lo ha prodotto. Questo è chiaramente ragionevole, perché tutto dipende da questa abitudine; ma non sarebbe ragionevole ottenere la giusta conclusione di un sillogismo ricordando in modo impreciso che si lascia fuori un termine che è comune ad entrambe le premesse. Usiamo ragionevole nel senso 1 quando parliamo di un argomento di uno scienziato questo non mi sembra ragionevole; nel senso 2 quando confrontiamo la ragione e superstizione o istinto; nel senso 3 quando si valuta il valore dei nuovi metodi di pensiero come la divinazione.]

2 Quello che segue fino alla fine della sezione è quasi interamente basato sugli scritti di C.S. Peirce . [Soprattutto le sue ” illustrazioni della Logica della scienza “, Popular Science Monthly 1877 e 1878 , ristampato in Chance Love and Logic ( 1923).]

Mettiamola in un altro modo: ogni volta che faccio una deduzione, la faccio in base a qualche regola o abitudine. Un’inferenza non è completamente data quando ci è data la premessa e la conclusione; deve essere data anche la relazione fra esse in virtù della quale viene realizzata la deduzione. La mente funziona per leggi generali; quindi se deduce q da p , questo sarà generalmente perché q è un caso di una funzione φx e p il corrispondente caso di una funzione ψx tale che la mente sempre dedurrà φx da ψx . Quando quindi non analizziamo le opinioni, ma i processi attraverso cui sono nate, la regola della deduzione determina per noi un intervallo a cui la teoria della frequenza può essere applicata. La regola di deduzione può essere ristretta, come quando vedendo un fulmine mi aspetto il tuono, o larga , come quando si considerano 99 casi di una generalizzazione che ho osservato per essere vera concludo che il centesimo anche è vero. Nel primo caso, l’abitudine che determina il processo è ‘ Dopo il lampo si aspetta il tuono ‘; il grado di affidamento che sarebbe il migliore per questa abitudine da esprimere è pari al rapporto tra i casi di lampi che siano effettivamente seguiti da tuoni. Nel secondo caso l’abitudine è quella più generale di inferire da 99 casi osservati un certo tipo di generalizzazione che il centesimo è anche vero; il grado di convinzione che sarebbe meglio per questa abitudine da esprimere è uguale alla proporzione di tutti i casi dei 99 esempi di una generalizzazione che è vera, in cui anche il centesimo è vero.

Così dato un unico parere , possiamo solo lodarlo o biasimarlo sulla base della verità o della falsità: data l’abitudine ad una certa forma, possiamo lodarlo o biasimarlo di conseguenza a seconda che il grado di convinzione che produce sia vicino o lontano dalla reale proporzione in cui l’abitudine conduce alla verità. Possiamo allora lodare o biasimare opinioni in forma derivata dalla nostra lode o biasimo delle abitudini che li producono.

Questa relazione può essere applicata non solo alle abitudini di deduzione, ma anche alle abitudini di osservazione e alla memoria; quando abbiamo una certa sensazione in relazione con un’immagine pensiamo che l’ immagine rappresenti qualcosa che in realtà è successo a noi, ma non possiamo esserne sicuri; il grado di diretta fiducia nella nostra memoria varia. Se ci chiediamo qual è il miglior grado di fiducia che possiamo riporre in una sicura specifica sensazione di memoria, la risposta deve dipendere da quanto spesso, quando questo sentimento si verifica l’evento a cui l’immagine si collega si è veramente verificato.

Tra le abitudini della mente umana una posizione di particolare importanza è occupata dall’induzione. Fin dai tempi di Hume molto è stato scritto circa la giustificazione dell’inferenza induttiva. Hume ha mostrato che non poteva essere ridotta a inferenza deduttiva o giustificata dalla logica formale. Nel modo in cui si sviluppa la sua dimostrazione mi sembra definitiva; e il suggerimento di Keynes che può essere aggirata per quanto riguarda l’induzione come una forma di inferenza probabile, non può a mio avviso essere accettato. Ma supporre che la situazione che ne deriva sia uno scandalo per la filosofia è, a mio avviso, un errore.

Siamo tutti convinti per ragionamenti induttivi, e la nostra convinzione è ragionevole, perché il mondo è così costituito che gli argomenti induttivi conducono tutto sommato a pareri veri. Non siamo, pertanto, in grado di avere fiducia nell’induzione, né se potessimo aiutarla non vedremmo alcuna ragione per cui dovremmo, perché noi crediamo che sia un processo affidabile. E vero che che se qualcuno non ha l’abitudine nell’induzione, non potremmo dimostrargli che sbaglia; ma non c’è nulla di particolare in questo. Se un uomo dubita della propria memoria o della sua percezione non possiamo dimostrargli che sono affidabili; il chiedere per questo una cosa che lo provi è piangere per la luna, e lo stesso vale per l’induzione. E’ una delle principali fonti di conoscenza così come lo è la memoria: nessuno considera uno scandalo per la filosofia che non c’è la prova che il mondo non sia cominciato due minuti fa e che tutti i nostri ricordi non siano illusori.

Siamo tutti d’accordo che un uomo che non ha fatto induzioni sarebbe non razionale: il problema è solo ciò che questo significa. A mio parere ciò non significa che l’uomo peccherebbe contro la logica formale o la probabilità formale; ma che non avrebbe acquisito un’abitudine molto utile, senza la quale starebbe molto peggio, nel senso di essere molto meno probabile 1 che abbia opinioni vere.

Si tratta di una sorta di pragmatismo: noi giudichiamo le abitudini mentali a seconda se funzionano, cioè se le opinioni che inducono siano per la maggior parte vere, o più spesso vere di quelle che differenti abitudini indurrebbero.

L’induzione è una abitudine utile, e ad adottarla è ragionevole. Tutto ciò che la filosofia può fare è di analizzarla, determinare il grado della sua utilità, e trovare da quali caratteristiche della natura, questa dipenda. Un mezzo indispensabile per indagare questi problemi è l’induzione stessa, senza la quale saremmo impotenti. In questa circolarità non si si trova nessun circolo vizioso. E’ solo attraverso la memoria che possiamo determinare il grado di accuratezza della memoria; perché se facciamo esperimenti per determinare questo effetto, essi saranno inutili se non li ricordassimo.

Si consideri, alla luce della discussione precedente quale tipo di soggetto sia induttivo o di logica umana – la logica della verità. La sua attività è quella di prendere in considerazione i metodi di pensare, e scoprire che misura di fiducia si debba riporre in questi, vale a dire in quale proporzione di esperienze essi conducono alla verità. In questa analisi essa può solo essere distinta dalle scienze naturali per la maggiore generalità dei suoi problemi. Si deve considerare la relativa validità dei diversi tipi di procedure scientifiche, come ad esempio la ricerca di una legge causale con i Metodi Mill, ed i moderni metodi matematici come il ragionamento a priori usato nella scoperta della Teoria della Relatività. Il progetto corretto di tale soggetto si può trovare in Mill 1, io non intendo i dettagli dei suoi Metodi o anche l’uso della Legge di Causalità. Ma il suo modo di trattare l’argomento come un corpo di induzioni riguardante induzioni, la Legge di Causalità che governa meno le leggi essendo essa stessa dimostrata per induzione per semplice enumerazione. I diversi metodi scientifici che possono essere utilizzati sono in ultima istanza valutati per induzione per semplice enumerazione; abbiamo scelto la più semplice legge che si adatta ai fatti, ma se non scopriamo che leggi così ottenute si adattano anche a fatti differenti da quelli per cui erano state realizzate per adattarsi, dobbiamo scartare questa procedura per qualche altra.

1 ‘probabile’ qui significa semplicemente che io non sono sicuro di questo, ma ho solo un certo grado di convinzione in esso.

 Cfr.. anche la relazione sulle ‘General rules’ nel capitolo ‘Of Unphilosophical Probability’ nel Trattato di Hume.