Tag Archives: economia

A MATHEMATICAL THEORY OF SAVING

1 Ott

stanleyOccorre chiarire che l’utilità di una decisione è un numero compreso tra 0 e 1 in quanto si definisce come la probabilità di ottenere la conseguenza migliore per effetto di una decisione.
Inoltre osservo che il lavoro di Frank Ramsey si basa sulla normalità decisionale perché ci si attende che una persona (ovvero un decisore con una durata limitata) o una nazione (ovvero un decisore con durata illimitata) si pongano il problema di quanto e quando spendere per massimizzare l’utilità individuale o nazionale rispettivamente. Purtroppo questi calcoli e questa logica sono stati soppiantati, non solo in Italia, da decisioni politiche che sarebbe stato impossibile prevedere in quanto fuori della logica di massimizzare l’utilità. Ad esempio da più di venti anni le decisioni politiche sono state tali da minimizzare l’utilità con una massimizzazione dell’indebitamento nazionale. Quindi si tratta, evidentemente, di una politica nell’interesse di pochi contro l’interesse nazionale che porta all’impoverimento progressivo della nazione.
Propongo la mia traduzione di questo articolo di Frank Plumpton Ramsey in quanto è una esposizione chiara della soluzione di problemi complessi in modo razionale. Così avrete la possibilità di confrontarla con le incoerenze ed i danni dei politici perpetrati alla nostra nazione ed a noi individualmente.
Il testo originale è stato pubblicato in The Economic Journal Vol. 38, No. 152. (Dic. 1928) pp. 543 – 559, vol. XXXIII – Blackwell Publishing for the Royal Economic Society ed è reperibile sul sito http://www.jstor.org/stable/2224098.

Questa è la traduzione.

UNA TEORIA MATEMATICA DEL RISPARMIO

I

Il primo problema che mi propongo di affrontare è questo: una nazione quanto deve risparmiare del suo reddito? Per rispondere a questo si ottiene una semplice regola valida in condizioni di generalità sorprendente: la regola, che sarà ulteriormente chiarita nel seguito, si sviluppa come segue.

Il tasso di risparmio moltiplicato per l’utilità marginale del denaro deve essere sempre pari all’importo per cui il tasso netto totale di godimento dell’utilità rimane ad disotto del tasso massimo di godimento .

Per giustificare questa regola è, ovviamente, necessario assumere varie ipotesi semplificatrici: dobbiamo supporre che la nostra comunità proceda per sempre, senza cambiare nei numeri né nella sua capacità di godimento né nella sua avversione al lavoro; che godimenti e i sacrifici in tempi diversi possano essere calcolati in modo indipendente e sommati; e che non siano introdotte nuove invenzioni o miglioramenti nell’organizzazione eccetto quelli che possono essere considerati come condizionati esclusivamente da un accumulo di ricchezza. 1

Dovrebbe forse essere sottolineato un punto, più in particolare; si presume che non diminuiamo i godimenti successivi rispetto a quelle precedenti, una pratica che è eticamente indifendibile e deriva solo dalla debolezza della fantasia; noi includeremo, comunque, nella sezione II un tasso di sconto in alcune delle nostre indagini.

Noi ignoriamo anche del tutto considerazioni distributive, assumendo, infatti , che il modo in cui il consumo e lavoro sono distribuiti tra i membri della comunità dipende unicamente dai loro importi totali, in modo che la soddisfazione totale è funzione unicamente di questi importi complessivi.

Oltre a questo , trascuriamo le differenze tra i diversi tipi di beni e diversi tipi di lavoro, e supponiamo questi siano espressi in termini di criteri prefissati, in modo che possiamo parlare semplicemente di quantità di capitali, di consumo e di lavoro senza discutere le loro forme particolari.

1 Ovvero devono essere tali che non avverrebbero senza un certo grado di accumulo, ma potrebbe essere previsto dato il relativo grado .

Non devono essere esclusi il commercio estero, prestiti e mutui, a condizione che assumiamo che le nazioni straniere sono in uno stato stabile, in modo che le possibilità di accordarsi con esse può essere inclusa nelle condizioni di produzione costante. Noi, tuttavia, respingiamo la possibilità che uno stato di indebitamento progressivo con l’estero continui per sempre.

Infine , dobbiamo presumere che la comunità sarà sempre governata dagli stessi  stimoli per quanto riguarda l’accumulo, in modo che non vi sia alcuna possibilità che i nostri risparmi vengano egoisticamente consumati da una generazione successiva; e che non si verifichino sventure da spazzare via gli accumuli in qualsiasi momento nel futuro pertinente.

Quindi indichiamo con x(t) e a(t) i tassi totali di consumo e di lavoro della nostra comunità, e con c (t) il suo capitale al tempo t. Il suo reddito è assunto come una funzione generale delle quantità di lavoro e capitale, e sarà chiamato f ( a, c ); abbiamo poi, dal momento che il risparmio più il consumo deve essere uguale reddito,

Schermata 2014-01-06 alle 18.46.22

Ora indichiamo con U( x ) il tasso totale di utilità di un tasso di consumo x; e con V( a) il tasso totale di disutilità di un tasso di lavoro a, e chiameremo le relative aliquote marginali u (x) e v (a); così che

Schermata 2014-01-06 alle 18.46.48

Supponiamo , come al solito, che u(x) non sia mai in aumento e che v(a) non diminuisca mai.

Ora dobbiamo introdurre un concetto di grande importanza nella nostra discussione. Supponiamo di avere un dato capitale c, e non lo stiamo né aumentando né diminuendo. Allora U(x) – V(a) denota il nostro godimento netto per unità di tempo, e andremo a renderlo massimo, a condizione che la nostra spesa x sia uguale a quella che possiamo realizzare con il lavoro a e il capitale a c. Il tasso di godimento risultante U(x) – V(a) sarà una funzione di c, e crescerà, fino ad certo punto, all’aumentare di c, poiché con più capitale possiamo avere più godimento.

Questo aumento del tasso di godimento con la quantità di capitale può, tuttavia, fermarsi per uno dei due motivi. Potrebbe, in primo luogo, accadere che un ulteriore incremento di capitale non ci permetterebbe di aumentare sia il nostro reddito sia il nostro svago; o, in secondo luogo, potremmo aver raggiunto il tasso massimo concepibile di godimento, e quindi non avremmo alcuna utilità per il maggiore reddito o per il maggiore svago.

In entrambi i casi un certo capitale finito ci darebbe il maggior tasso di godimento economicamente ottenibile, sia che questo sia o non sia il massimo tasso concepibile.

D’altra parte, il tasso di godimento non può mai smettere di aumentare, all’aumentare del capitale. Vi sono poi due possibilità logiche: o il tasso di godimento aumenterà fino all’infinito, o si avvicinerà asintoticamente ad un certo limite finito. Il primo di questi casi si può escludere per il fatto che cause economiche da sole non potrebbero mai darci più di un certo tasso finito di godimento (chiamato sopra il tasso massimo concepibile). Resta il secondo caso, in cui il tasso di godimento si avvicina ad un limite finito, che può essere o può non essere uguale al tasso massimo concepibile. Questo limite si deve chiamare il tasso massimo ottenibile di godimento, anche se non può, a rigore, essere ottenuto, ma solo approssimato indefinitamente.

Quello che abbiamo in vari casi chiamato il tasso massimo ottenibile di godimento o l’utilità chiameremo per brevità Felicità o B. E in tutti i modi possiamo vedere che la comunità deve risparmiare abbastanza o per raggiungere la Felicità dopo un tempo finito, o almeno per approssimarla in un tempo indeterminato. Perché solo in questo modo è possibile raggiungere l’importo per cui il godimento ricade nell’intorno di una felicità somma nel tempo una quantità finita; in modo che se dovesse essere possibile raggiungere la felicità o avvicinarla in un tempo indeterminato, questo sarà infinitamente più desiderabile di ogni altra direzione di azione.

Ed è destinata ad essere possibile, dal momento che mettendo da parte una piccola somma ogni anno siamo in grado nel tempo di aumentare il nostro capitale di una qualsiasi misura desiderata . 1

Abbastanza deve quindi essere risparmiato per raggiungere o approssimarsi alla felicità in un qualche periodo di tempo, ma questo non significa che tutto il nostro reddito deve essere risparmiato. Più viene risparmiato più presto raggiungeremo una felicità, ma meno piacere avremmo adesso, e dovremmo mettere l’una cosa contro l’altra. Keynes mi ha mostrato che la norma che regola la quantità da risparmiare può essere determinata immediatamente da queste considerazioni. Ma prima di spiegare la sua tesi sarà meglio sviluppare quelle equazioni che possono essere utilizzate nei problemi più generali che considereremo più avanti .

1 Così com’è questo argomento è incompleto, in quanto in quest’ultimo caso sopra considerato la felicità era il valore limite, con un capitale che tende all’infinito, del godimento ottenibile spendendo tutto il nostro reddito, e quindi non effettuando alcun accantonamento per un ulteriore aumento del capitale. La lacuna può essere facilmente riempita osservando che per risparmiare £ 1 / n nell’anno n-esimo sarebbe sufficiente aumentare il capitale sociale all’infinito (dal momento che Σ 1 / n è divergente), e che la perdita di reddito (£ 1 / n ) si ridurrebbe allora a zero, in modo che i valori limite di reddito e le spese sarebbero gli stessi .

La prima di queste risulta dall’uguagliare la disutilità marginale del lavoro in qualsiasi momento al prodotto della efficienza marginale del lavoro con l’utilità marginale del consumo in quel momento,

ovveroSchermata 2014-01-06 alle 18.48.00

La seconda uguaglia il vantaggio derivato da un incremento Δx di consumo al tempo t, con quello derivante dal rinviarlo per un periodo di tempo infinitesimale Δt , che aumenterà il suo valore di Schermata 2014-01-06 alle 18.48.23, dal momento che Schermata 2014-01-06 alle 18.48.41           dà il tasso di interesse guadagnato dall’attesa.

Questo dà

Schermata 2014-01-06 alle 18.48.53

o al limite

Schermata 2014-01-06 alle 18.49.04

Questa equazione indica che u(x), l’utilità marginale del consumo, scende proporzionalmente ad un tasso dato dal tasso di interesse. Di conseguenza x aumenta continuamente a meno che o fino a che o Schermata 2014-01-06 alle 18.48.41 o u (x) si annulla, nel qual caso è facile vedere che la felicità  deve

essere stata raggiunta.

Le equazioni ( 1 ) , ( 2 ) e ( 3) sono sufficienti a risolvere il problema purché conosciamo c0, il capitale dato con cui la nazione inizia a t = 0, l’altra “condizione iniziale” essendo fornita dalle considerazioni riguardanti il comportamento della funzione per t → ∞ .

Per risolvere le equazioni procediamo come segue:  notando che x , a e c sono tutte funzioni di una variabile indipendente, cioè il tempo,

abbiamo

Traduzione Schermata 2014-01-06 alle 18.49.25

Di conseguenza , integrando per parti

Traduzione Schermata 2014-01-06 alle 18.51.48

o

Schermata 2014-01-06 alle 18.52.59

Ora dobbiamo individuare K con quello che abbiamo chiamato B, o felicità.

Ciò è più facilmente fatto iniziando in un modo diverso.

Schermata 2014-01-06 alle 18.53.16

rappresenta l’importo per cui il godimento è di poco inferiore alla felicità integrato nel tempo; questo è (o può essere reso) finito, e il nostro problema è quello di minimizzarlo.

Se applichiamo il calcolo delle variazioni da subito, usando l’equazione ( 1 ), otteniamo di nuovo le equazioni ( 2 ) e ( 3); ma se, invece di questo, prima cambiamo la variabile indipendente con c, otteniamo una grande semplificazione. Il nostro integrale diventa

Traduzione Schermata 2014-01-06 alle 18.53.31

Ora, in questa x ed a sono funzioni completamente arbitrarie di c, e per minimizzare l’integrale dobbiamo semplicemente minimizzare l’integrando uguagliando a zero le sue derivate parziali. Prendendo la derivata rispetto a x si ottiene:

Traduzione Schermata 2014-01-06 alle 18.55.37

o , come abbiamo detto all’inizio,

il tasso di risparmio moltiplicato per dell’utilità marginale del consumo deve essere sempre uguale alla felicità meno il tasso effettivo di utilità goduta.

Keynes, al quale sono grato per molti altri suggerimenti, mi ha mostrato che questo risultato può anche essere ottenuto mediante il seguente semplice ragionamento.

Supponiamo che in un anno dovessimo spendere £ x e risparmiare £ z .

Allora il vantaggio di acquistare da un extra di £ 1 spesa è u (x), l’utilità marginale del denaro, e questo deve essere uguale al sacrificio imposto risparmiando £ 1 in meno.

1 Il limite superiore non sarà ∞ , ma il minimo capitale con cui può essere ottenuta la felicità, se questo è finito. c aumenta costantemente con t, ad un certo tasso fino a che l’integrando svanisce , così che la trasformazione è ammissibile.

Risparmiare 1 £ in meno nell’anno significherà che risparmieremo solo £ z in 1 + 1 / z anni, non, come prima, in un anno. Di conseguenza, saremo in tempo 1 +1 / z anni esattamente dove avremmo dovuto essere nel tempo di un anno, e tutto l’andamento del nostro approccio alla felicità sarà posticipato di 1 / z anni, in modo che godremo 1 / z di un anno in meno di felicità e 1 / z anni di più al nostro attuale tasso.

Il sacrificio è, dunque,

Schermata 2014-01-06 alle 18.57.49

 

Uguagliandolo ad u ( x ), otteniamo di nuovo l’equazione ( 5 ), se sostituiamo z  con   Schermata 2014-01-06 alle 18.58.07     , il suo valore limite.

Purtroppo questo semplice ragionamento non può essere applicato quando prendiamo in considerazione l’attualizzazione, e pertanto ho mantenuto le mie equazioni ( 1) – ( 4) , che possono essere facilmente estese per affrontare i problemi più complessi.

La caratteristica più notevole della regola è che è del tutto indipendente dalla funzione di produzione f(a , c), tranne che nella misura in cui ciò determina la felicità, il tasso massimo di utilità ottenibile.

In particolare l’importo che dovremmo risparmiare di un determinato reddito è del tutto indipendente dall’attuale tasso di interesse, a meno che questo sia in realtà pari a zero. Il carattere paradossale di questo risultato risulterà in una certa misura mitigato più avanti, quando troviamo che se il futuro è scontato ad un tasso ρ costante e il tasso di interesse è costante e pari a r, la quota di reddito da risparmiare è una funzione del rapporto ρ / r . Se ρ = 0 tale rapporto è 0 ( a meno che anche r sia 0) e la percentuale da risparmiare è quindi indipendente da r.

Il tasso di risparmio che la regola impone è notevolmente superiore a quello che chiunque normalmente suggerirebbe, come si può vedere dalla tabella seguente, che viene presentata solo come un esempio.

Traduzione Schermata 2014-01-06 alle 18.58.28

Se trascuriamo le variazioni nella quantità di lavoro, l’importo che deve essere risparmiato su un reddito familiare di £ 500 sarebbe di circa £ 300. Perché allora la felicità meno tasso effettivo di utilità = 8-3 = 5 . Risparmio = £ 300 e l’utilità marginale del consumo di £ 200 = circa 1 / 60 £ . ( Da £ 150 a £ 300 U (x) = 13x/300 -3 – x2 / 15000, che corrisponde approssimativamente ad una parabola, così che u (x) = 13/300 – x/7500 = 1/60 se x = 200.)

Vale la pena soffermarsi un attimo a considerare quanto le nostre conclusioni sono influenzate dalle considerazioni che le nostre ipotesi semplificatrici ci hanno costretto a trascurare. Il probabile aumento della popolazione costituisce una ragione per risparmiare ancora di più, e così anche la possibilità che le invenzioni future metteranno il livello di felicità più in alto di quello che appare adatto al presente. D’altra parte, la probabilità che le invenzioni e i miglioramenti nell’organizzazione futuri sono atti a rendere gli introiti ottenibili con minor sacrificio di quello attuale è una ragione per risparmiare di meno. L’influenza delle invenzioni così opera in due modi opposti: ci fornisce nuovi bisogni che possiamo soddisfare meglio se abbiamo risparmiato in precedenza, ma anche aumenta la nostra capacità produttiva e rende il risparmio precedente meno pressante.

Il fattore più grave trascurato è la possibilità di future guerre e terremoti che distruggono le nostre accumulazioni. Questi non possono essere adeguatamente calcolati perché col determinare un tasso di interesse molto basso per lunghi periodi, dal momento che possono rendere il tasso di interesse effettivo negativo, distruggono come fanno non solo gli interessi, ma anche il capitale.

II

Propongo ora di considerare che il compenso del capitale e del lavoro siano costanti e indipendenti, 1 in modo che

f (a , c) = pa + rc

dove p, il tasso dei salari, e r, il tasso di interesse, sono costanti .

Questa ipotesi ci permetterà

(a) Di rappresentare la nostra precedente soluzione con un semplice diagramma ;

(b) Di estenderla al caso di un individuo che vive solo un tempo finito;

(c) Di estenderla per includere il problema in cui i futuri valori di utilità e di disutilità siano attualizzati ad un tasso costante.

1 Vale la pena notare che nella maggior parte di (a) si richiede solo l’indipendenza dei rendimenti, e non la costanza, e che in nessun luogo abbiamo davvero bisogno che i salari siano costanti, ma queste ipotesi sono fatte per semplificare del tutto la formulazione. Sono meno assurdi se lo stato è uno fra quelli che avanzano lentamente, in modo che i tassi di interesse e i salari sono in gran parte indipendenti da ciò che il nostro stato particolare risparmia e guadagna .

Nella nostra nuova ipotesi il reddito della comunità si divide in due parti ben definite, pa ed rc, che sarà conveniente chiamarle rispettivamente introito da guadagno e introito da rendita .

( a) L’equazione ( 2 ), che ora leggiamo

v (a) = pu( x )

determina a come funzione della sola x, e possiamo utilmente porre

y = x – pa = consumo – redditi da lavoro

w ( y) = u ( x ) = v ( a) / p

W ( y) = ∫ w (y) dy = ∫ (u (x) dx – v (a) da) = U (x) – V (a)

W ( y) può essere chiamata utilità totale e w (y) l’utilità marginale del reddito da capitale, dal momento che sono utilità totali e marginali derivanti dal possesso di una rendita y disponibile per il consumo.

L’equazione ( 5 ), ora ci dà

Traduzione Schermata 2014-01-06 alle 19.04.25

il che significa che il punto ( rc , B) si trova sulla tangente in y alla curva z = W (y) .

La figura ( 1 ) mostra la curva z = W ( y) , che raggiunge sia il valore B ad un valore y1 finito (il caso mostrato in figura) oppure vi si avvicina asintoticamente per y → ∞ .

Al fine di determinare la quantità di una data rendita rc che deve essere risparmiata, prendiamo il punto P, ( rc , B), sulla linea z = B, e da esso tiriamo una tangente alla curva (non z = B , che sarà sempre una tangente, ma l’un’altra) . Se l’ascissa di Q , il punto di contatto, è y, una quantità y della rendita verrebbe consumata, e il resto, rc – y, verrebbe risparmiata. Naturalmente y può essere negativa, il che significherebbe che non solo l’intera rendita sarà risparmiata, ma anche una parte del reddito da lavoro.

E ‘ facile vedere che ci deve essere sempre un tale tangente, perché la curva z = W (y) avrà una tangente o asintoto y = – η , dove η è il più grande eccesso di introiti rispetto al consumo compatibile con il mantenimento dell’esistenza.

Questa regola determina la quantità di un determinato reddito che dovrebbe essere spesa, ma non ci dice a quanto il nostro reddito ammonterà dopo un certo lasso di tempo . Questo è ottenuto dall’equazione ( 3 ) , che ora ci dà

Traduzione Schermata 2014-01-06 alle 19.06.03

Qui A = w (y0), dove y0 è il valore di y per t = 0 determinato come ascissa di Q , dove P è (rc0,B) .

Supponiamo, allora, che vogliamo trovare il tempo impiegato ad accumulare un capitale c da un capitale iniziale c0 , assumiamo che  P sia il punto ( rc , B ) e P0 sia ( rc0 , B ). w (y) è poi la pendenza della tangente da P, e w(y ) la pendenza della tangente da P0, in modo che nel momento in questione

Traduzione Schermata 2014-01-06 alle 19.07.18

 

Traduzione 2014-01-06 alle 19.11.04

( b) Supponiamo ora che ci occupiamo di un individuo che vive solo per un tempo determinato, diciamo T anni, invece di una comunità che vive per sempre. Abbiamo ancora l’equazione (4)

Traduzione Schermata 2014-01-06 alle 19.16.05

ma K non è più uguale a B , e deve ancora essere determinata.

Per trovarla dobbiamo sapere quanto capitale il nostro uomo sente necessario lasciare ai suoi eredi; chiamiamo questo c3.

L’equazione ( 8 ) indica, come prima che y può essere trovato come l’ascissa del punto di contatto Q di una tangente tirata da ( rc , K ) ovvero P alla curva. P si trova sempre su z = K , e la sua ascissa comincia da rc0 e finisce in rc3. K si può assumere come minore di B, poiché un uomo che vive solo un tempo finito risparmierà meno di chi vive un tempo infinito, e maggiore sarà K , maggiore sarà il tasso di risparmio. Di conseguenza, z = K incontrerà la curva , diciamo in P4.

Schermata 2014-01-06 alle 20.32.34

Da entrambi P0 e P3 ci saranno due tangenti alla curva, di cui o la superiore o quella inferiore può, per quanto ne sappiamo, essere presa come determinante y0 e y3 Se, tuttavia, c3 > c0 come in fig . 2, possiamo solo prendere la tangente inferiore da P0, perché la tangente superiore dà un valore di y0 maggiore di uno dei valori di y3 , che è impossibile, in quanto y aumenta in modo continuo. Prendendo, poi , Q0 come il punto di contatto della tangente inferiore da P0, ci sono due possibili casi, secondo se prendiamo  y3 come determinante o di Q3, il minore, o Q3‘, il valore superiore. Se prendiamo Q3, P0 porta direttamente a P3, e qui ci sarà sempre risparmio; questo accade quando T è piccolo. Ma se T è grande, Q0 porta direttamente a Q3‘, e P0 va in primo luogo a P4, e poi indietro a P3, all’inizio qui c’è il risparmio, e successivamente sperpero.

Allo stesso modo , se c0 > c3 , ci sono due possibili casi, e in questo caso è la tangente inferiore da P3 che non può essere presa .

Al fine di determinare quali tangenti prendere e anche il valore di K dobbiamo utilizzare la condizione derivata dall’equazione (7)

Traduzione Schermata 2014-01-06 alle 20.33.06

Questo , unitamente al fatto che le ascisse di P0 e P3 sono c0, c3, e che hanno la stessa ordinata K , è sufficiente a fissare sia K e le tangenti da adottare.

(c) Dobbiamo ora vedere come i nostri risultati devono essere modificati quando non riteniamo le future utilità e disutilità uguali a quelle attuali, ma le attualizziamo ad un tasso costante ρ.

Questo tasso di attualizzazione di vantaggi futuri deve, naturalmente, essere distinto dal tasso di attualizzazione di future somme di denaro.

Se posso prendere in prestito o dare  in prestito ad un tasso r devo necessariamente essere altrettanto soddisfatto con un extra di £ 1 ora e un extra  £ (1 + r) dopo un anno, dal momento che potrei scambiare l’ uno con l’altro. Il mio tasso marginale di sconto per il denaro è, dunque, necessariamente r, ma il mio tasso di sconto per l’utilità può essere molto diverso, dal momento che l’utilità marginale del denaro per me può variare per il mio aumentare o diminuire della spesa col passare del tempo .

Assumendo il tasso di sconto costante, non voglio dire che è lo stesso per tutti gli individui dal momento che attualmente ci occupiamo di un solo individuo o di una comunità, ma che il valore attuale di un godimento ad una qualche data futura deve essere ottenuto attualizzandolo al tasso ρ. Così, assumendo che sia circa 3/4 per cento, l’utilità in certo momento sarebbe considerata come due volte più desiderabile di quella di cento anni più tardi, quattro volte più preziosa che 200 anni più tardi, e così via ad un tasso di attualizzazione composto.

Questa è l’unica ipotesi che possiamo fare, senza contraddire la nostra ipotesi fondamentale che le generazioni successive sono mosse dallo stesso sistema di preferenze. Infatti, se avessimo avuto un tasso variabile di attualizzazione – vale a dire dire uno più alto per i primi 50 anni – la nostra preferenza per godimenti nel 2000 d.C. rispetto a quelli del 2050 d.C. verrebbero calcolati al tasso più basso, ma quello delle persone vive nel 2000 d.C. sarebbe al valore più alto.

Supponiamo in primo luogo che il tasso di sconto per l’utilità ρ sia inferiore al tasso di interesse r.

Allora le equazioni (1) e (2) sono invariate, ma l’equazione (3) diventa

Schermata 2014-01-06 alle 20.36.05

se stiamo assumendo   Schermata 2014-01-06 alle 20.36.18       costante e uguale a r;

Traduzione Schermata 2014-01-06 alle 20.36.55

Questa equazione è la stessa della (8) tranne che invece di w(y) e W(y), che è ∫ w(y) dy, abbiamo wr / (r – ρ )(y) e  ∫ w r / (r – ρ )(y) dy.

Il metodo di soluzione sia per una comunità sia per un individuo è dunque lo stesso di prima, tranne che al posto dell’effettiva utilità della rendita da capitale dobbiamo considerare che possiamo affermare la sua utilità modificata, ottenuta integrando l’utilità marginale alla potenza r/(r-ρ). Questo ha l’ effetto di accelerare la diminuzione dell’utilità marginale e di diminuire l’importanza relativa di alti redditi. In questo modo possiamo tradurre la nostra attualizzazione del futuro in una attualizzazione di alti redditi. La velocità con cui questo viene fatto è disciplinata esclusivamente dal rapporto ρ su r, in modo che se ρ è 0, esso è indipendente dal valore di r, purché questo non sia 0. La conclusione principale della sezione I viene così confermata.

Vi è, tuttavia , una piccola difficoltà, perché non abbiamo ancora veramente dimostrato che se consideriamo un tempo infinito, la costante K deve essere interpretata come quella che si potrebbe chiamare “felicità modificata”, vale a dire il valore massimo di Schermata 2014-01-06 alle 20.42.01

Questa felicità modificata richiederebbe lo stesso reddito come per la felicità, essendo la modifica esclusivamente nel valore impostato su di essa. Questo risultato può tuttavia essere dedotto immediatamente dall’equazione ( 9a ), che dimostra che y aumenta fino a che si

raggiunge la felicità, così che  Schermata 2014-01-06 alle 18.58.07        non possa mai diventare negativa e K non può essere inferiore alla felicità modificata. D’altra parte, purché questa condizione sia soddisfatta, la 9 (a) mostra che più grande è la y inizialmente, più piccola sarà la A,  più grande sarà y nel tempo futuro. Quindi K deve essere la più piccola possibile (purché non sia così piccola da rendere Schermata 2014-01-06 alle 18.58.07             in fine negativa) ; in modo che K non può essere maggiore della felicità modificata. Quindi se non è né inferiore né maggiore  deve essere uguale.

Come in (b), si può adattare la nostra soluzione al caso di un individuo con solo un tempo finito di vita, così in questo caso disegnerò le tangenti alla curva di utilità modificata.

Un caso particolare interessante è quella di una comunità per la quale

Traduzione Schermata 2014-01-06 alle 20.42.50

E’ chiaro che corrisponde a K = B nel caso in cui ρ = 0

abbiamo qui K = K1

e il risparmio  Schermata 2014-01-06 alle 20.44.46ovvero, una percentuale costante Schermata 2014-01-06 alle 20.44.57     della rendita da capitale deve essere risparmiata, che se ρ = 0 sarà   Schermata 2014-01-06 alle 20.45.13                   e indipendente da r.

Se il tasso di interesse è inferiore al tasso di attualizzazione dell’utilità, avremo equazioni simili, che portano ad un risultato molto diverso. L’utilità marginale del consumo aumenterà ad un tasso ρ –  r, e il consumo scenderà verso il livello più basso di sussistenza per il quale la sua utilità marginale può essere presa come infinita, se trascuriamo la possibilità del suicidio. Durante questo processo tutto il capitale verrà consumato e i debiti contratti si estenderanno a quelli da cui sono stati ottenuti, l’ipotesi più semplice a questo punto è che sarà possibile prendere in prestito una somma tale che è solo possibile per restare in vita dopo aver pagato gli interessi su di essa.

III

Consideriamo ora il problema della determinazione del tasso di interesse .

(α) In primo luogo, supponiamo che tutti attualizzano l’utilità futura per sé o per i propri eredi, allo stesso tasso ρ.

Allora in uno stato di equilibrio non ci sarà alcun risparmio e

Traduzione Schermata 2014-01-06 alle 20.45.38

tre equazioni per determinare x , a e c .

L’ ultima equazione ci dice che il tasso di interesse come determinato dalla produttività marginale del capitale   Schermata 2014-01-06 alle 20.36.18            , deve essere uguale al tasso di attualizzazione ρ.1

Ma supponiamo che in un dato momento, diciamo quello presente,  Schermata 2014-01-06 alle 20.36.18         > ρ.

Allora non ci sarà equilibrio, ma il risparmio, e poiché una grande quantità non può essere risparmiata in un breve periodo di tempo, potrebbe volerci secoli prima che l’equilibrio sia raggiunto, o può non essere mai raggiunto, ma solo approssimato asintoticamente; e si pone la questione di come, nel frattempo, il tasso di interesse viene determinato, poiché non può esserlo dall’equazione ordinaria di equilibrio della domanda e dell’offerta .

La difficoltà è che il tasso di interesse non funziona come richiesta di prezzo per un intera quantità di capitale, ma come un prezzo di fornitura, non per una quantità di capitale, ma per un tasso di risparmio. Lo stato risultante della situazione è rappresentata in fig. 3, in cui, tuttavia, variazioni della quantità di lavoro sono trascurate. Questo mostra la curva di domanda per il capitale r =Schermata 2014-01-06 alle 20.36.18    , la curva definitiva di offerta r = ρ e la curva temporanea di offerta c = c0 .

È chiaro che il tasso di interesse è determinato direttamente dalla intersezione della curva di domanda con le temporanea curva di offerta c = c0. La curva definitiva di offerta r = ρ entra in gioco solo in quanto disciplina il tasso al quale c0 approssima il suo valore definitivo OM , un tasso che dipende approssimativamente dal rapporto di PM su QN. Vediamo, dunque , che il tasso di interesse è disciplinato principalmente dal prezzo di domanda, e può superare di gran lunga la ricompensa definitiva necessaria per indurre l’astinenza.

1 L’ equilibrio potrebbe, tuttavia, essere ottenuto o alla felicità  con ρ < Schermata 2014-01-06 alle 20.36.18      , o al livello di sussistenza con  ρ >  Schermata 2014-01-06 alle 20.36.18  . Cfr. ( γ ) di seguito .

Allo stesso modo, nella contabilità di uno Stato Socialista la funzione del tasso di interesse garantirebbe l’uso più saggio del capitale esistente, non servirebbe in alcun modo diretto come guida per la quota di reddito che deve essere risparmiata.

(β) Ora dobbiamo cercare di tenere un po’ in conto il fatto che persone diverse attualizzano l’utilità futura a tassi differenti, e, a parte il fattore tempo, non sono abbastanza interessati ai loro eredi come in loro stessi.

Supponiamo che non siano interessati affatto ai loro eredi;

Schermata 2014-01-06 alle 20.48.25

che ad ogni uomo è imposta una quota del mantenimento di quei bambini che sono necessari per mantenere in esistenza la popolazione, ma inizia la sua vita lavorativa, senza alcun capitale e si conclude senza alcuno, dopo aver speso i suoi risparmi in una annualità; che all’interno della sua propria vita ha un programma di utilità costante per il consumo e l’attualizzazione di utile futuro ad un tasso costante, ma che questo tasso si può supporre diverso per persone diverse.

Quando tale comunità è in equilibrio , il tasso di interesse deve, ovviamente0, essere uguale al prezzo di offerta di capitale  Schermata 2014-01-06 alle 20.36.18       . E sarà anche uguale al ” prezzo di fornitura “che nasce nel seguente modo.

Supponiamo che il tasso di interesse sia costante e pari a r, e che il tasso di attualizzazione di un determinato individuo sia ρ. Allora, se r > ρ, egli risparmierà quando è giovane, non solo per provvedere per la perdita della capacità di guadagno in età avanzata, ma anche perché può ottenere più sterline da spendere in un secondo momento rispetto a quelle che rinuncia a spendere ora. Se trascuriamo le variazioni nella sua capacità di guadagno, la sua azione può essere calcolata modificando le equazioni IIc applicandole ad una vita definita come in IIb. Egli accumulerà per un periodo il capitale, e quindi lo spenderà prima di morire. A parte quest’uomo, dobbiamo supporre che ci siano nelle nostre comunità altri uomini, esattamente come lui, tranne che per essere nati in tempi diversi. Il capitale totale posseduto da n uomini di questo tipo le cui date di nascita sono distribuite uniformemente per tutto il periodo di una vita sarà n volte il capitale medio posseduto da ciascuno nel corso della sua vita. La classe degli uomini di questo tipo possederà, dunque, un capitale costante a seconda del tasso di interesse, e questo sarà l’importo del capitale da essi fornito a quel prezzo. (Se ρ > r, potrebbe essere negativo, in quanto potrebberoro prendere in prestito da giovani e rimborsare da vecchi.) Possiamo quindi ottenere la curva di offerta totale del capitale sommando le forniture ad un determinato prezzo per ciascuna classe dei singoli individui.

Se, poi, si trascura l’interesse degli uomini nei loro eredi, vediamo che il capitale ha un prezzo di cessione determinato per essere equiparato al suo prezzo di domanda. Questo prezzo di offerta dipende da tassi di attualizzazione delle persone per l’utilità, e può essere equiparato al tasso di attualizzazione del “risparmiatore marginale”, con il significato di qualcuno il cui tasso di attualizzazione è pari al tasso di interesse che né risparmia né prende a prestito (salvo per provvedere  alla vecchiaia ) .

Ma la situazione è diversa dal problema di fornitura ordinaria, in questo che quelli oltre questo “margine ” non forniscono semplicemente nulla, ma determinano una prestazione negativa prendendo in prestito quando sono giovani contro i loro guadagni futuri, ed essendo mediamente in debito.

(γ) Ora torniamo al caso (α) immaginando uomini, o piuttosto famiglie, che vivono per sempre, e il tasso di attualizzazione dell’utilità futura costante, ma cerchiamo questa volta di tener conto delle variazioni del tasso di attualizzazione da famiglia a famiglia.

Per semplicità supponiamo che la quantità di lavoro è costante, in modo che il reddito totale del paese può essere considerato come una funzione f(c), del solo capitale. Il tasso di interesse sarà allora f”(c). Supponiamo anche che ogni individuo possa raggiungere la massima utilità concepibile con un reddito x1 finito, e che nessuno potrebbe sostenersi in vita con meno di x2.

Ora supponiamo che l’equilibriosi ottenga con un capitale c, reddito f(c), e un tasso di interesse f'(c) o r. Allora queste famiglie, diciamo in numero di m(r), il cui tasso di attualizzazione è inferiore a r devono aver raggiunto la felicità o starebbero ancora aumentando la loro spesa secondo l’equazione (9a). Di conseguenza, esse avranno tra loro un reddito m (r).x1. Le altre famiglie, in numero n – m (r) (dove n è il numero totale delle famiglie), devono essere al livello di sussistenza, o starebbero ancora diminuendo le loro spese. Di conseguenza queste avrebbero tra loro  un reddito complessivo { n – m(r)} x2,

Traduzione Schermata 2014-01-06 alle 20.49.46

che, insieme con r = f ‘( c ), determina r e c.  Essendo m (r) una funzione crescente di r, è facile vedere, disegnando i grafici di r in funzione di f ( c ), che le due equazioni hanno in generale una unica soluzione unica 2.

In tal caso, quindi, l’equilibrio sarebbe raggiunto da una divisione della società in due classi, la classe parsimoniosa che gode della felicità e una improvvida al livello di sussistenza.

F.P. Ramsey

King’s College , Cambridge.

1 Si è supposta ogni famiglia in equilibrio, che è l’unico modo in cui questo stato può essere mantenuto,dal momento che altrimenti, sebbene i risparmi di alcuni bilancerebbero in ogni istante i prestiti degli altri, non continuerebbero a farlo se non per un fatto straordinario.

2 Abbiamo trascurato in questo il numero trascurabile di famiglie per cui ρ è esattamente uguale a r.

THE DOUGLAS PROPOSALS

26 Set

Ramsey_2Riporto la mia traduzione di un interessante articolo di economia di Frank Ramsey il cui testo originale si trova negli Archivi del Dipartimento di Filosofia Scientifica Collezione Speciale dell’Università di Pittsburg (al Box n.7, folder 3 parte 1)

Si tratta della contestazione di una teoria economica, con purtroppo ancora dei seguaci, che si basa su un errore di logica non facilmente determinabile se non attraverso un corretto ragionamento partendo da casi semplici e con un sistema di analisi più complesso per contenere tutti i casi possibili.

Clifford Hugh Douglas (1879 -1952) sosteneva (L’illusione della Super – Produzione dell’anno 1918, Democrazia economica – Il credito e la democrazia dell’anno 1920)  che la somma di stipendi, salari e dividendi sono inferiori ai prezzi dei beni e servizi prodotti settimanalmente e pertanto i lavoratori non possono avere denaro sufficiente ad acquistare i beni ed i servizi prodotti. Ne conclude che il sistema della contabilità rende tecnicamente impossibile la consegna di merci e servizi e quindi il sistema è costruito per massimizzare i profitti di chi ha il potere economico (questo forse è vero, ma per altri e più banali motivi) e realizzare un’inutile scarsità. Il ragionamento appare, a prima vista plausibile, ma è errato nella maggior parte dei casi come dimostra Ramsey.

Questo saggio rivela il brillante ingegno matematico di Frank Ramsey e la sua capacità di operare in ambiti logici diversissimi. Secondo quanto riportato da Keynes gli economisti si recavano da lui per avere conferma o contestazione delle loro elaborazioni oppure per tradurre in formule le loro valutazioni.

Credo che questo genio ci manchi molto nella situazione attuale.

Vorrei notare come nelle sue dimostrazioni sia molto chiaro l’ambito di applicabilità ed i limiti delle teorie che espone. Purtroppo è una qualità che manca a molti attuali economisti che operano, spesso con effetti catastrofici, con teorie molto matematiche e poco coerenti con le condizioni al contorno o quelle della realtà. Per non parlare di chi usa formule matematiche di terzi senza sapere dove si possono applicare e le applica a sproposito in situazioni che nulla hanno a vedere con l’analisi che si vuole fare.

Quindi c’è da sperare che anche le formule esposte in questo articolo non vengano prese ed usate a sproposito.

Questa è la traduzione.

I CONCETTI PROPOSTI DA  DOUGLAS

A chi è interessato ai concetti proposti da Douglas raccomanderei di studiare Dividendi per tutti, di W. Allen Young, un libretto da sei penny in possesso di evidenti vantaggi sia in termini di brevità e chiarezza rispetto all’esposizione del Maggiore Douglas stesso che è sempre oscuro e spesso assurdo. Le affermazioni più importanti si possono trovare nelle pag. 13 e 20.

(1) ” Si sostiene che i salari, gli stipendi e i dividendi emessi in qualsiasi periodo unitario di tempo non sono mai sufficienti ad acquistare i prodotti finali immessi per la vendita durante lo stesso periodo. ”

(2) “Un nuovo fondamento per i prezzi. – I beni di uso finale (ad esempio il carbone per uso domestico) saranno venduti a meno del loro costo, alla stessa frazione del costo (che è quello che include tutti i dividendi e utili) come il Consumo Totale di tutte le Merci sostiene  la Totale Produzione di Credito Effettivo durante uno specifico periodo di tempo. Con questo metodo, i prezzi attuali sarebbero ridotti a circa un quarto del costo totale ……..

“il Governo rimborserà ai proprietari (ad esempio, i proprietari di miniera di carbone) la differenza tra il costo complessivo sostenuto, e il loro prezzo totale ricevuto, per mezzo di buoni del Tesoro, tali buoni verrebbero addebitati come avviene adesso sul conto del Debito Nazionale.”

A favore di (1) Young afferma: “ll prezzo è quindi costituito da due grandi somme erogate dal Produttore: (A) Tutte le somme versate per le materie prime e spese generali, e (B) tutti gli importi versati in salari, stipendi e dividendi. Quindi il prezzo è uguale a (A) più (B). Ma il denaro pagato come(B) è tutto il denaro che al consumatore di questo paese è dato per comprare le merci che lui stesso aiuta a produrre con la propria attività manuale, con il cervello o con il capitale ….. Pertanto, (B), la quantità di denaro totale emessa, non sarà mai sufficiente a comprare tutte le merci il cui prezzo è (A) più (B). ”

Quindi afferma “È stato sostenuto dagli oppositori a questo schema che di nove fabbriche che forniscono prodotti finali per il consumo questo può essere vero; ma che nello stesso periodo di tempo una decima fabbrica produrrà merci intermedie che non rientrano nel mercato al consumo, ma in relazione alle quali vengono emessi i salari, gli stipendi e dividendi  che possono assorbire l’eccedenza dagli altri nove.” Oltre alla precisione o meno del rapporto di nove a uno, questo argomento è molto semplice e sembra mostrare una vera e propria falla nel ragionamento di Douglas, in modo che è fondamentale esaminare attentamente ciò che Young dice in risposta ad esso. La sua risposta è triplice : –

“(a) La moneta emessa dalla decima fabbrica non poggia su una relazione matematica definita rispetto al valore del prezzo dei beni di consumo finali immessi sul mercato dalle altre nove fabbriche, e non sarebbe sufficiente a bilanciarli se i relativi prezzi rimangono stabili.”

Ma mentre questo non gli sta bene esiste una relazione matematica precisa, dal momento che egli stima che il deficit totale di potere d’acquisto pari a 1 : 4. E in ogni caso l’affermazione che il denaro può o non può essere sufficiente non può essere considerata come una prova che non sia sufficiente.

” (b) Ma i loro prezzi non rimangono costanti. I grossisti e i dettaglianti, quando il denaro della decima fabbrica entra nel mercato, trovano che la domanda è salita senza che la produzione sia cresciuta. Essi quindi aumentano i prezzi. In altre parole, l’effetto del denaro introdotto dalla decima fabbrica non è di eliminare l’eccedenza di tutte le merci in eccedenza delle altre nove, ma solo di eliminare qualcuna di queste, fino a che un aumento dei prezzi bilanci la nuova moneta introdotta nel mercato. Così i prezzi crescono per chi ricava denaro dalle altre nove fabbriche, che rende ancora più impossibile per questi (che ricava denaro dalle altre nove fabbriche) di acquistare tutti i beni di prodotti finali, se lo volessero fare.”

Questo argomento fallisce lo scopo; quello che viene suggerito, in risposta alla tesi di Douglas è che nello stesso periodo di tempo altre fabbriche produrrebbero merci non per il consumo immediato e che i salari e i dividendi versati da quelle fabbriche potrebbero costituire una distribuzione di potere d’acquisto sufficiente a consentire che il surplus venga acquistato . Come è evidente, i salari dei lavoratori che producono prodotti intermedi, come il carbone per uso industriale, sono un fattore sempre presente nella domanda di beni di consumo; non ha senso parlare di un aumento dei prezzi quando questi salari entrano nel mercato.

Ma anche se non fallisse lo scopo, l’asserzione non è plausibile . Ex hipotesi è impossibile vendere, anche al costo, una gran parte dei beni di consumo prodotta. Se poi ci fosse qualche concorrenza, è poco probabile che i prezzi saliranno al di sopra dei costi in qualche misura apprezzabile.

” (c) Anche nel periodo successivo di tempo i costi totali della decima fabbrica entrano nei prezzi dei beni finali prodotti dalle altre nove “. (Certamente.) ” Così la velocità del flusso del potere di acquisto è sempre minore della velocità di flusso dei prezzi. “Questo è ciò che sta cercando di dimostrare, e chiaramente non consegue dall’osservazione precedente. Questo argomento è una mera affermazione del punto da provare.

Usiamo “prezzo di costo ” per includere il conservare il capitale, ma non il costo per aumentarlo, questo è ovviamente il corretto utilizzo, ed è, penso quello di Douglas e dei suoi seguaci. Abbiamo visto che non sono stati avanzati motivi da Douglas per pensare che il rapporto, che il prezzo di vendita deve dare rispetto al prezzo di costo se il potere d’acquisto distribuito è in grado di acquistare tutti i beni di consumo prodotti, sia inferiore all’unità. Ma questo può, tuttavia, essere il caso.

Vi è, tuttavia, un argomento forte e semplice per supporre che il rapporto non differisca sensibilmente dall’unità. Perché è facile vedere che in uno stato stazionario, cioè quello in cui la produzione va avanti a un ritmo immutabile e i prezzi, i salari e la ricchezza nazionale non cambiano mai, il rapporto sarebbe l’unità. Perché in un tale stato il tasso di flusso del costo dei beni di consumo prodotti è A + B con la notazione introdotta qui sopra, dove A , B vengono sommati per tutte le fabbriche che producono beni di consumo. Il potere d’acquisto è distribuito da queste fabbriche in ragione di B. Ma il tasso degli altri pagamenti A essendo fatto da queste fabbriche, rappresenta i pagamenti dei dividendi e dei salari fatte in un momento precedente da altre fabbriche che producono prodotti intermedi. Pertanto, nell’ipotesi di produzione immutabile , la distribuzione del potere d’acquisto da tutte queste altre fabbriche procede al tasso A. In modo che il tasso globale di distribuzione o potere d’acquisto è A + B, che equivale al tasso di flusso del prezzo di costo dei beni di consumo. Poiché il rapporto è l’unità per uno stato stazionario, è improbabile che allo stato attuale differisca notevolmente dall’unità, perché lo stato attuale non è molto lontano dall’essere stazionario.

Ma è possibile utilizzando alcune complicate operazioni matematiche dimostrare che il rapporto è l’unità sotto condizioni molto più ampie, che consentono di tenere conto di variazioni della quantità di produzione, del tasso dei salari, della produttività del lavoro, della ricchezza nazionale. La prova di questo è riportata di seguito, ma saranno in grado di seguirla solo quelli  che hanno familiarità con l’integrazione per parti.

Partiamo dal presupposto che tutto il lavoro è esprimibile in termini di unità o di lavoro . Che i risultati del lavoro sono merci, non necessariamente prodotti finiti, ma può darsi miglioramento di  merci e, in ogni caso esprimibile in termini di unità che dobbiamo chiamare, in mancanza di meglio, unità di merce. La nozione di merce comporta la nozione di utilità, in modo che le merci meno utili conterrebbero meno unità di merce. Chiameremo la produttività del lavoro in un dato momento il numero di unità di merci derivanti da una unità di lavoro ad un certo istante. La produttività per esempio si ridurrebbe se terreni meno fertili vengono messi in coltivazione, e aumenterebbe se la produzione fosse organizzata in modo più efficiente.

Sia T l’istante di tempo considerato.

Siano W(T) i salari pagati per unità di lavoro all’istante T.

Sia P (T) la produttività del lavoro all’istante T.

Quindi il numero di unità di lavoro necessari per produrre un’unità di merce è 1 / P ( T ), e il suo costo è W (T) / P (T).

Il tasso al quale vengono aggiunte unità di merce al tempo T ai beni che saranno effettivamente completi e  disponibili per il consumo al tempo t successivo sarà chiaramente funzione sia di T sia di t. Dobbiamo porre alcune ipotesi circa la forma di questa funzione, e l’unica che sembra condurre ad un’analisi funzionale è che la funzione in questione è il prodotto di una funzione di T e una funzione di t: vale a dire, che le proporzioni in cui al tempo T il lavoro viene speso per beni che saranno disponibili per il consumo a diversi intervalli di tempo è indipendente da T. (Questa ipotesi potrebbe essere incompatibile con le  fluttuazioni industriali e quindi implicare una semplificazione o valutazioni sulla media dei processi). Indichiamo questo prodotto con F (T) f (t). Quindi i salari pagati in ragione di unità di merce aggiunta al tempo T ai beni che saranno effettivamente pronti per il consumo al successivo tempo t  saranno F (T) f (t) W (T) / P (T) , e noi proponiamo di abbreviare e scrivere B (T) f (t).

Assumiamo un tasso costante continuo di interesse r, in modo che se z è la quantità di capitale C dopo il tempo t abbiamo dz / dt = rz, che fornisce z = Cert; e questo è anche il costo sostenuto in qualsiasi momento dopo aver speso C al tempo t in precedenza.

Per motivi pratici, è lecito ritenere che il periodo massimo tra l’inizio del lavoro su un bene e il suo completamento non superi una certa quantità finita t0.

Possiamo ora definire il capitale nazionale in possesso di chi controlla l’industria in qualsiasi momento pari alle merci incomplete accumulate al prezzo di costo (comprensivo di interessi), e supponiamo che un equivalente esatto in titoli ed azioni sia stato distribuito al pubblico a cui i controllori pagano interessi al tasso r, e che la variazione di questo capitale sia sempre accompagnata da un pari ammontare di nuovi prestiti da parte del pubblico o dal rimborso di tali prestiti.

La velocità di flusso dei prezzi di costo dei beni che diventano disponibili per il consumo al tempo T è

Schermata 2014-01-04 alle 21.04.05

perché il prodotto B (T – t ) f ( t ) rappresenta i salari pagati al tempo T – t in conto dei beni che diventano disponibili al successivo tempo t, cioè al tempo T, e il fattore di ert è inserito al fine di ottenere il costo effettivo sostenuto quando l’interesse viene preso in considerazione . Allo stesso modo la velocità con cui i salari vengono pagati al tempo T è

Schermata 2014-01-04 alle 21.16.04

Anche il capitale nazionale al tempo T come definito sopra è

Schermata 2014-01-04 alle 21.16.49

Perché B (T-u) f ( t) dt rappresenta i salari pagati al momento T-u in conto dei beni che si renderanno disponibili fra il tempo t e il successivo t + dt; e stiamo considerando solo i beni che sono incomplete al tempo T, vale a dire, al tempo u successivo a T-u , dobbiamo integrare dal valore minimo di t ovvero u , al valore massimo t0 , così che

Schermata 2014-01-05 alle 15.35.14

rappresenta i salari pagati al momento T-u per tutti i beni che risulteranno incompleti al tempo T; il fattore e si inserisce come prima, al fine di tener conto degli interessi.

I dividendi essendo versati al pubblico in qualche istante di tempo ammonteranno a r volte il capitale nazionale.

Il tasso al quale vengono costituiti nuovi prestiti da parte del pubblico è il coefficiente differenziale con riferimento al momento del capitale nazionale, vale a dire dC (T) / dt .

Supponiamo ora che x (T) sia il rapporto che abbiamo cercato di trovare, cioè il rapporto che i prezzi di vendita dei beni di consumo dovrebbero avere sui prezzi di costo al tempo T in modo che non ci sarebbe né un accumulo di beni di consumo invendibili né di potere d’acquisto invendibile nelle mani del pubblico. Quindi uguagliamo il tasso totale a cui il pubblico riceve il potere d’acquisto in forma di salari e dividendi con i prezzi d’acquisto delle merci risultanti disponibili per il consumo ed il tasso a cui il pubblico costituisce nuovi investimenti, quindi abbiamo

Schermata 2014-01-05 alle 15.59.18

Mostreremo ora che questa equazione può essere soddisfatta solo se x (T) = 1 .

Perché, integrando per parti il coefficiente di x ( T ) e assumendo che B ( T ) sia continua e derivabile, abbiamo

Schermata 2014-01-05 alle 15.59.37

e un confronto di questa equazione con l’ultima mostra che x (T ) = 1 .

Abbiamo ottenuto questo risultato imponendo determinate condizioni, ed è interessante vedere come il risultato è influenzato dalle variazioni di condizioni. La prima condizione che, nel calcolo dei costi, l’interesse è preso ad un tasso fisso r, non possiamo farne a meno; ma in condizioni modificate potremmo ammettere un tasso variabile di interesse sugli investimenti calcolando i dividendi al tasso r su un capitale nominale. L’altra condizione stabilita era l’uguaglianza del capitale nominale con il capitale nazionale come definito, e che le variazioni di questo siano  sempre accompagnate da nuovi investimenti o dal rimborso di investimenti . Passiamo fare a meno di queste condizioni e chiamare Q (T) il capitale nominale al tempo T e supponiamo che L (T), che definiamo come il tasso (positivo o negativo) a cui il pubblico investe il denaro, non sia necessariamente uguale a dQ (T) / dt . Quindi l’equazione per x ( T ) diventa

Schermata 2014-01-05 alle 16.22.50

Abbiamo visto che se sostituiamo C (T) con Q (T) e dC (T) / dT con L (T) allora x (T) = 1 . Ne segue che x (T) è maggiore o inferiore all’unità , a seconda se

rQ (T) – L T) > oppure < rC (T) – dC (T) / dt ,

o se

r { Q (T) – C (T) } > oppure < L (T) – dC (T) dT .

Possiamo riassumere i principali casi in cui x (T) < 1 , come segue : –

(1) Supponiamo che L (T)= dQ (T) / dt , cioè , l’aumento del capitale nominale sia accompagnato da nuovi uguali investimenti; allora x (T) < 1 se dZ (T) / dt > rZ (T) , dove Z ( T) è uguale a (Q(T) – C(T) ), e può essere chiamata la capitale fittizio .

Quindi;

(a) Z ( T ) > 0, ( cioè , lo stato è sovracapitalizzato) – in questo caso il tasso di aumento di capitale fittizio deve superare il tasso di interesse; una situazione che non può essere mantenuta a lungo, così questo caso non è importante

Oppure ( b) Z (T) < 0 , cioè , le stato è sottocapitalizzato – in questo caso x (T) < 1, a meno che il tasso percentuale di aumento della sottocapitalizzazione superiore al tasso di interesse (ad esempio, uno stato socialista non paga alcun interesse, ma calcolandolo come un elemento di costo venderebbe chiaramente sotto costo).

(2) Supponendo che Q (T) = C (T), cioè, non vi è capitale fittizio, allora x (T) < 1 se L (T) > dC(T) / dT cioè , > dQ (T) / dT . Questo potrebbe solo normalmente accadere se nuovi investimenti portassero interessi ad un tasso s (poniamo ) < r, tasso a cui l’interesse è stimato in termini di costo. In questo caso l’ipotesi Q (T) = C (T) significa che il tasso di nuovi investimenti da’ al tasso di incremento del capitale nazionale il rapporto r : s.

Così che le uniche circostanze importanti alle quali dobbiamo vendere sotto costo, vale a dire 1(b), quando i dividendi vengono pagati meno del capitale nazionale; e la (2) quando il tasso di interesse sui nuovi investimenti è inferiore a quello in cui l’interesse è calcolato come un elemento di costo, sono come sarebbe ovvio per il senso comune ed è chiaramente irrilevante la tesi del Maggiore Douglas che “giusto prezzo” è oggi un quarto del prezzo di costo.

F.P. Ramsey

The Foundation of Mathematics di Frank Ramsey – Capitolo IX Last papers – Sezione F. LA FILOSOFIA

28 Giu

Pacioli_1Riporto la mia traduzione della sezione F. del capitolo IX  del libro The Foundation of Mathematics di Frank Plumpton Ramsey pubblicato a cura di R.B. Braithwaite. 

IX

LAST PAPERS

F. LA FILOSOFIA

La filosofia deve essere di qualche utilità e dobbiamo prenderla sul serio; deve chiarire sul serio i nostri pensieri e le nostre azioni. Oppure si tratta di una disposizione che abbiamo per controllare, e una richiesta di vedere che questo è così; cioè la proposizione principale della filosofia è che la filosofia è un nonsenso. E ancora dobbiamo allora prendere sul serio che è un nonsenso, e non avere la presunzione, come fa Wittgenstein, che è un importante nonsenso!

In filosofia assumiamo le proposizioni che facciamo nella scienza e nella vita quotidiana, e cerchiamo di esporle in un sistema logico con termini primitivi e definizioni, ecc. Essenzialmente una filosofia è un sistema di definizioni o, troppo spesso, un sistema di descrizioni di come le definizione dovrebbero essere.

Non credo sia necessario dire con Moore che le definizioni spiegano quello che abbiamo finora inteso con le nostre proposizioni, ma piuttosto che esse mostrano come abbiamo intenzione di utilizzarle in futuro. Moore direbbe che sarebbe la stessa cosa, che la filosofia non cambia quello che chiunque intende per ‘Questo è un tavolo ‘. Mi sembra che potrebbe essere; perché il significato è principalmente potenziale, e un cambiamento potrebbe quindi manifestarsi solo in rare e critiche occasioni. Inoltre a volte la filosofia potrebbe chiarire e distinguere le nozioni precedentemente vaghe e confuse, e chiaramente questo significa solo fissare il nostro futuro significare. 1 Ma questo è chiaro, che le definizioni ci sono per dare almeno il senso al nostro futuro, e non soltanto di dare un qualche grazioso modo di ottenere una determinata struttura.

1 Ma per quanto nel nostro significato passato non sia assolutamente confuso, la filosofia naturalmente fornirà anche quello. Ad esempio il paradigma della filosofia, la teoria delle descrizioni di Russell .

Sono abituato a trarmi d’impaccio sulla natura della filosofia da un eccessivo scolasticismo. Non potrei vedere come potremmo comprendere una parola e non essere in grado di riconoscere se una definizione proposta di essa sia o non sia corretta. Non compresi la vaghezza di tutta l’idea del comprendere, il riferimento che ciò coinvolge per una moltitudine di adempimenti ognuno dei quali può essere respinto e richiedere di essere ricostituito. Problemi di logica nelle tautologie, di matematica nelle identità, di filosofia nelle definizioni; tutto banale, ma tutto parte del lavoro vitale di chiarire e organizzare il nostro pensiero .

Se consideriamo la filosofia come un sistema di definizioni (e delucidazioni nell’uso di parole che non possono essere nominalmente definite), le cose che mi appaiono come problemi a riguardo sono le seguenti:

( 1) Quali definizioni ci sentiamo di assegnare alla filosofia, e quali lasciamo alle scienze o le sentiamo come del tutto inutili fornire?

( 2) Quando e come possiamo essere soddisfatti senza una definizione, ma semplicemente con una descrizione di come una definizione potrebbe essere data? [ Questo punto è menzionato sopra.]

( 3) Come può l’indagine filosofica essere condotta senza una continua petitio principii?

(1) La filosofia non si occupa di problemi specifici di definizione, ma solo di quelli generali: non si propone di definire particolari termini dell’arte o della scienza, ma di stabilire ad esempio i problemi che sorgono nella definizione di uno qualsiasi di tali termini o nella relazione di qualsiasi termine nel mondo fisico con i termini dell’esperienza.

Le relazioni dell’arte e della scienza, tuttavia, devono essere definiti, ma non necessariamente nominalmente; ad esempio definiamo la massa spiegando come misurarla, ma questa non è una definizione nominale; si limita a fornire il termine ‘ massa ‘ in una struttura teorica come un evidente rapporto a certi fatti sperimentali. Le relazioni che non abbiamo bisogno di definire sono quelle che sappiamo di poter definire se sorgesse il bisogno, come ‘ sedia ‘ , o quelle che come “club” (il seme delle carte) possiamo tradurre facilmente nel linguaggio visivo o qualsiasi altro linguaggio, ma non possiamo utilmente ampliare a parole.

( 2) La soluzione a quello che abbiamo chiamato in (1) un ‘ problema generale di definizione ‘ è naturalmente una descrizione di definizioni, da cui impariamo a formare le effettive definizioni in ogni caso particolare. Questo che così spesso ci sembra non dare nessuna effettiva definizione, è perché la soluzione del problema è spesso che la definizione nominale è inadeguata, e che ciò che si vuole è una spiegazione dell’uso del simbolo.

Ma questo non tocca ciò che dovrebbe essere  considerata la vera difficoltà sotto questo punto (2); per quello che abbiamo detto si applica solo al caso in cui la parola da definire sia semplicemente descritta (perché trattata come un termine di una classe), la sua definizione o spiegazione è anche, ovviamente, solamente descritta, ma descritta in modo tale che quando è data la parola effettiva la sua definizione effettiva ne può essere derivata. Ma ci sono altri casi in cui la parola da definire essendo data, non ci viene data in cambio nessuna definizione di essa ma una affermazione che il suo significato coinvolge entità di tali – e – tali tipi in questi  e questi modi, vale a dire una affermazione che ci darebbe una definizione se avessimo i nomi per queste entità.

Per quanto riguarda l’uso di questo, è chiaramente per adattarsi al termine in relazione alle variabili, per porla come valore della variabile complessa; e ciò presuppone che possiamo avere variabili senza nomi per tutti i loro valori. Domande difficili sorgono sul fatto se saremmo sempre in grado di dare un nome a tutti i valori, e se sì di che tipo di capacità questo significa, ma è chiaro che il fenomeno è in qualche modo possibile in relazione alle sensazioni per  le quali la nostra lingua è così frammentaria. Ad esempio , ‘ la voce di Jane ‘ è una descrizione di una caratteristica di sensazioni per la quale non abbiamo un nome. Forse potremmo darle un nome, ma possiamo identificare e denominare le diverse inflessioni di cui è composta?

Un’obiezione spesso fatta a queste descrizioni delle definizioni delle caratteristiche sensoriali è che esse esprimono ciò che dovremmo trovare nell’analisi, ma che questo tipo di analisi cambia la sensazione analizzata con l’ampliare la complessità che questa ha la presunzione di scoprire. E’ indubitabile che tale attenzione può cambiare la nostra esperienza, ma mi sembra possibile che a volte rivela una complessità preesistente (cioè ci permette di attribuire adeguatamente un simbolo a questa), perché questo è compatibile con qualsiasi cambiamento nei fatti connessi, perfino con qualsiasi cosa ad eccezione di una creazione della complessità.

Un’altra difficoltà per quanto riguarda le descrizioni delle definizioni è che se ci accontentiamo di esse possiamo ottenere semplicemente un nonsenso con l’introdurre variabili prive di senso, ad esempio, variabili descritte come ‘ particolari ‘ o idee teoriche come ‘punto’. Potremmo ad esempio dire che con ‘ macchia ‘ si intende una classe infinita di punti; in tal caso dovremmo rinunciare alla filosofia per la psicologia teorica. Perché nella filosofia analizziamo il nostro pensiero, in cui macchia non potrebbe essere sostituita da una classe infinita di punti: non potremmo determinare una particolare classe infinita estensionalmente, ‘ Questa macchia è rossa ‘ non è l’abbreviazione di ‘ a è rosso e b è ecc. rosso .. . . ‘ Dove a, b , ecc., sono punti.

(Come sarebbe se solo a non fosse rosso?) Classi infinite di punti potrebbero entrare in ballo solo quando osserviamo la mente dall’esterno e costruire una teoria di ciò, in cui il suo campo sensoriale consiste di classi di punti colorati sui quali si ragiona.

Ora, se abbiamo costruito questa teoria circa la nostra stessa mente dovremmo considerarla o come ragionamento su certi fatti, ad esempio, che questa macchia è di colore rosso; ma quando stiamo pensando alle menti di altre persone non abbiamo fatti, ma siamo del tutto nel regno della teoria, e può convincere noi stessi che queste costruzioni teoriche esauriscono il campo. Torniamo allora indietro sulle nostre menti, e diciamo che quello che sta realmente accadendo qui sono semplicemente questi processi teorici. L’ esempio più calzante di questo è, naturalmente, il materialismo. Ma molte altre filosofie, ad esempio di Carnap, fanno lo stesso errore.

(3) La terza domanda è come possiamo evitare la petitio principii, il pericolo da cui sorge abbastanza come segue: –

Al fine di chiarire il mio pensiero il metodo corretto sembra essere semplicemente di riflettere fra me e me ‘ Cosa intendo con questo? ‘ Quali sono le nozioni distinte coinvolte in questo termine ?’ ‘Tutto questo veramente deriva da quest’altro ? ‘ ecc., e di verificare l’identità del significato di un proposto definiens e del definiendum per mezzo di esempi reali e ipotetici. Questo si può spesso fare senza pensare alla natura del significato stesso; possiamo dire se intendiamo le stesse cose o cose diverse con ‘ cavallo ‘ e ‘ maiale’ senza pensare affatto al significato in generale. Ma al fine di risolvere questioni più complicate di tal genere noi abbiamo ovviamente bisogno di una struttura logica, un sistema di logica, in cui porle. Possiamo sperare di ottenerlo da una precedente relativamente facile applicazione degli stessi metodi; per esempio, non dovrebbe essere difficile vedere che perché sia non -p o non -q vero è proprio la stessa cosa che per entrambi p e q di non essere veri. In questo caso, costruiamo una logica, e facciamo tutta la nostra analisi filosofica del tutto inconsciamente, pensando tutto il tempo a dei fatti e non sul nostro pensare ad essi, decidendo che cosa intendiamo senza alcun riferimento alla natura dei significati. [Naturalmente potremmo anche pensare alla natura del significato in maniera inconscia; cioè pensare a un caso di significato di fronte a noi senza fare riferimento al nostro intenderlo.] Questo è un metodo e potrebbe essere quello corretto; ma credo che è sbagliato e conduce ad un vicolo cieco, e mi dissocio da esso nel modo seguente.

Mi sembra che nel processo di chiarire il nostro pensiero perveniamo a termini e frasi che non siamo in grado di spiegare nel modo ovvio definendone il loro significato. Ad esempio, le variabili ipotetiche e i termini teorici non li possiamo definire, ma siamo in grado di spiegare il modo in cui vengono utilizzati, e in questa spiegazione siamo costretti a guardare non solo agli oggetti di cui stiamo parlando, ma anche ai nostri propri stati mentali.

Come direbbe Johnson, in questa parte della logica che non possiamo trascurare l’epistemologia o il lato soggettivo.

Ora, questo significa che non possiamo fare chiarezza su questi termini e frasi senza fare chiarezza sul significato, e ci sembra di entrare in una situazione che non possiamo comprendere ad esempio quello che diciamo sul tempo e il mondo esterno senza prima comprendere il significato e ancora non riusciamo a comprendere il significato senza prima comprendere senza dubbio il tempo e probabilmente il mondo esterno che sono coinvolti in esso. Quindi non possiamo fare la nostra filosofia in un progresso ordinato per un obiettivo, ma dobbiamo prendere i nostri problemi nel loro insieme e giungere a una soluzione simultanea; che avrà qualcosa della natura di una ipotesi, perché noi l’accetteremmo non come la conseguenza di un ragionamento diretto, ma come l’unica che noi possiamo pensare di quelle che soddisfano i nostri diversi requisiti.

Naturalmente, non parleremmo rigorosamente dell’argomento, ma c’è in filosofia un processo analogo alla ‘ inferenza lineare ‘ in cui le cose diventano successivamente evidenti; e dal momento che, per il motivo di cui sopra, non possiamo portare questo fino alla fine, siamo nella posizione normale degli scienziati di dover accontentarsi di miglioramenti frammentari: possiamo fare molte cose più chiare, ma non possiamo fare tutto chiaro.

Trovo questa autocoscienza inevitabile in filosofia, tranne in un campo molto limitato. Siamo spinti a filosofare perché non sappiamo chiaramente che cosa intendiamo; la domanda è sempre ‘ Cosa intendo con x ? ‘ E solo molto occasionalmente possiamo risolvere questo senza riflettere sul significato. Ma non è solo un ostacolo, questa necessità di affrontare il significato; è senza dubbio un indizio essenziale sulla verità. Se lo trascuriamo sento che possiamo entrare nella posizione assurda del bambino nel seguente dialogo : ‘Dì breakfast.’ ‘ Non posso. ‘ ‘ Che cosa non puoi dire ? ‘ ‘ Non posso dire breakfast.’

Ma la necessità di auto-coscienza non deve essere utilizzata come giustificazione per ipotesi assurde; stiamo facendo filosofia non psicologia teoretica, e le nostre analisi delle nostre affermazioni, sia sul significato o su qualsiasi altra cosa, devono essere tali che le possiamo capire.

Il pericolo principale per la nostra filosofia, a parte la pigrizia e la confusione, è lo scolasticismo, la cui essenza è trattare ciò che è vago, come se fosse preciso e cercando di inserirlo in una precisa categoria logica. Un parte tipica dello scolasticismo è il punto di vista di Wittgenstein che tutte le nostre proposizioni di tutti i giorni sono completamente in ordine e che è impossibile pensare illogicamente.

(Quest’ultima è come dire che è impossibile rompere le regole del bridge, perché se le rompi non stai giocando a bridge, ma, come dice la signora C., a non – bridge.) Un altro è il ragionamento sulla conoscenza del prima che porta alla conclusione che noi percepiamo il passato. Un semplice esame del telefono automatico dimostra che reagiremmo in modo diverso a AB e BA senza percepire il passato, così che l’argomento è sostanzialmente infondato. Questo pone l’accento nel giocare con ‘ conoscenza ‘ che significa, in primo luogo, la capacità di simbolizzare e, in secondo luogo, la percezione sensoriale. Wittgenstein sembra equivocare esattamente nello stesso modo, con la sua nozione di ‘ dato ‘.

TRUTH AND PROBABILITY- Cap. VII di The Foundation of Mathematics di Frank Plumpton Ramsey

21 Giu

Dennis V. LindleyPropongo la mia traduzione del settimo capitolo di The Foundation of Mathematics di Frank Ramsey pubblicato a cura di R.B. Braithwaite.

Questo capitolo è la base dei moderni sistemi di valutazione in condizioni di incertezza. Grazie a questa magnifica elaborazione matematica di temi complessi e ragionamenti solo in parte elaborati da altri autori tra cui Wittgenstein, Donkin, Pierce e Blake Ramsey ha costruito un sistema matematico solido e straordinariamente valido per la valutazione delle scelte umane basato sull’inscindibilità dei due elementi soggettivi probabilità e utilità dell’esito delle decisioni. Questa metodologia è valida solo per un mondo non deterministico (quindi è il logico e necessario superamento del galileismo nella scienza), libero e razionale. Ramsey prende le mosse dalla contestazione, dal punto di vista logico, dell’ipotesi di Keynes che si possano costruire algoritmi per definire la probabilità in modo oggettivo. Tale metodologia è, purtroppo, ancora in uso da parte di importanti istituzioni pubbliche con la sola finalità di definire le condizioni per non avere problemi con la giustizia se si applicano queste formule. Ma generalmente determina gravi errori di valutazione in quanto rappresenta un metodo per rendere oggettiva una grandezza che non può esserlo in quanto dipende oltre che dalla storia del decisore, dal suo carattere e dal sentimento di utilità che egli attribuisce ad una determinata decisione.

La linea di pensiero di Ramsey è anche importante perché esclude la possibilità di far coincidere l’utilità delle scelte con la teoria filosofica dell’Utilitarismo (qui credo sia ben presente l’influenza di Ludwig Wittgenstein). Si tratta infatti di elementi che apparentemente e solo in taluni casi appaiono convergenti, ma in realtà sono concetti del tutto diversi. L’utilità di una decisione è un numero compreso tra 0 e 1 in quanto si può definire come la probabilità di ottenere la conseguenza migliore per effetto di una decisione.

Rammento ai lettori che il prof. Dennis V. Lindey ha pubblicato sull’argomento un libro divulgativo (Making Decisions- John Wiley and Sons Ltd- 1985) per l’uso del metodo di Ramsey che permette in modo semplice di valutare la coerenza di una decisione indicando i passaggi necessari per pervenirvi. Il concetto di coerenza per le proprie scelte, legato quindi a regole personali, è per definizione un metodo soggettivo che riguarda il singolo decisore.

Il lavoro di Lindley andrebbe completato con l’analisi delle tendenze psicologiche del decisore per rendere maggiormente utile il sistema. 

Il metodo di Keynes, che non tiene conto di questo, porta necessariamente ad errori di valutazione perché è uguale per tutti i decisori. In ultima analisi è un metodo che potrebbe essere gradito ai regimi totalitari o comunque a quei sistemi politici che non considerano la libertà un bene fondamentale e fondante della natura umana.

VII

VERITA’ E PROBABILITÀ (1926)

Dire di che quello che è che non è e di quello che non è che è, è falso mentre il dire di quello che è che è e di quello che non è che non è, è vero. – Aristotele.

Quando diverse ipotesi si presentano alla nostra mente che riteniamo essere reciprocamente esclusive ed esaustive, ma di cui non sappiamo altro, noi distribuiamo equamente la nostra convinzione tra queste…..

Ammettendo questo come motivo del modo in cui effettivamente distribuiamo la nostra convinzione in casi semplici, tutta la successiva teoria segue come deduzione del modo in cui dobbiamo distribuirla in casi complessi, se vogliamo essere coerenti. – W.F. Donkin.

L’oggetto del ragionamento è quello di scoprire, dalla considerazione di quello che già sappiamo, qualcos’altro che non sappiamo. Di conseguenza, il ragionamento è buono  se è tale da dare una vera conclusione da premesse vere, e non altrimenti. – C.S. Peirce.

La verità non può mai essere presentata come se sia da comprendere, e non come se sia da credere. – W. Blake.

PREMESSA

In questo saggio la teoria della probabilità è assunta come un ramo della logica, la logica della parziale convinzione e di materia non completamente definita; ma non vi è alcuna intenzione di implicare che questo è l’unico e anche il più importante aspetto del discorso. La probabilità è di fondamentale importanza non solo nella logica, ma anche nella scienza statistica e nella fisica, e non possiamo essere sicuri in anticipo che la più utile interpretazione di essa nella logica sarà appropriata anche nella fisica. Infatti la differenza principale di opinione fra gli statistici che per la maggior parte adotta la teoria della probabilità sulla base della frequenza e i logici che per lo più la respingono rende probabile che le due scuole stiano veramente discutendo differenti questioni, e che la parola ‘probabilità’ venga usata dai logici in un senso e dagli statistici in un altro. Le conclusioni a cui arriveremo circa il significato di probabilità in logica non devono, pertanto, pregiudicare il suo significato nella fisica.1

1 [Il capitolo finale, sulla probabilità nella scienza, è stato progettato ma non scritto. – Ndr].

SOMMARIO

(1) La teoria della frequenza

(2) La teoria di Keynes

(3) Il gradi di convinzione

(4) La logica della coerenza

(5) The Logica della verità

(1) LA TEORIA  DELLA FREQUENZA

Nella speranza di evitare alcune controversie puramente verbali, mi propongo di iniziare facendo qualche ammissione a favore della teoria della frequenza. In primo luogo, a questa teoria deve essere concesso di avere una solida base nel linguaggio comune, che utilizza spesso ‘probabilità’ praticamente come sinonimo di proporzione; per esempio, se diciamo che la probabilità di guarigione dal vaiolo è di tre quarti, si intende, credo, semplicemente che questa sia la proporzione di casi di vaiolo che guariscono. In secondo luogo, se iniziamo con quello che viene chiamato il calcolo delle probabilità, considerandolo dapprima come un ramo della matematica pura, e poi guardandosi intorno per qualche interpretazione delle formule, che devono dimostrare che i nostri assiomi sono coerenti e il nostro argomento non del tutto inutile, allora la molto più semplice e la meno controversa interpretazione del calcolo è quella in termini di frequenze. Questo è vero non solo della ordinaria matematica della probabilità, ma anche del calcolo simbolico sviluppato da Keynes; perché se nel suo a / h, a e h sono prese per essere non proposizioni, ma funzioni proposizionali o concetti-classe che definiscono classi finite, e per a/h si intende la proporzione di membri di h che sono anche membri di a, allora tutte le sue proposizioni diventano truismi aritmetici.

Oltre a queste due inevitabili considerazioni, ce n’è una terza e più importante, che io sono pronto ad assumere temporaneamente anche se non esprime la mia vera opinione. E questa è la seguente. Supponiamo di Iniziare con il calcolo matematico, e chiedere, non come prima cosa quale interpretazione di esso sia più comoda per il matematismo puro, ma quale interpretazione fornisce i risultati di maggior valore per la scienza in generale, allora può essere che la risposta sia ancora una volta un’interpretazione in termini di frequenza; questa probabilità come viene utilizzata in teorie statistiche, in particolare in meccanica statistica – il tipo di probabilità il cui logaritmo è l’entropia – è realmente un rapporto tra i numeri, di due classi, o il limite di quel rapporto. Non ci credo, ma sono disposto per ora a concedere alla teoria della frequenza che questa probabilità come utilizzata nella scienza moderna sia in realtà la stessa cosa della frequenza.

Ma, supponendo tutto ciò ammesso, rimane ancora il caso che noi abbiamo sia l’autorità del linguaggio comune sia di molti grandi pensatori per discutere sotto il titolo di probabilità quello che sembra essere piuttosto un argomento diverso, la logica della convinzione parziale. Può darsi che, come alcuni sostenitori della teoria della frequenza hanno sostenuto, la logica della convinzione parziale si troverà alla fine essere semplicemente lo studio delle frequenze, sia perché la convinzione parziale sarebbe definibile come, o per relazione, una sorta di frequenza, o perché può essere oggetto di un trattamento logico solo quando si fonda sulla frequenze sperimentali. Se queste affermazioni sono valide possono tuttavia essere stabilite solo come un risultato della nostra indagine sulla convinzione parziale, così che io propongo di ignorare la teoria della frequenza al presente e avviare un’indagine sulla logica della convinzione parziale. In questo, credo, sarà più conveniente se, invece di sviluppare da subito la mia teoria, comincio esaminando le opinioni di Keynes, che sono così ben conosciute e in sostanza così ampiamente accettate che i lettori probabilmente credono che non vi sia alcun motivo per riaprire il tema de novo fino a quando siano state demolite.

(2) LA TEORIA DI KEYNES

Keynes 1 parte dal presupposto che facciamo inferenze di probabilità per le quali asseriamo una validità oggettiva; si procede dalla convinzione piena in una proposizione alla convinzione parziale in un’altra, e noi riteniamo che questa procedura è oggettivamente giusta, in modo che se un altro uomo in circostanze simili avesse un diverso grado di convinzione, in questo sbaglierebbe. La ragione di questa ipotesi di Keynes è di supporre  che fra due qualsiasi proposizioni, date come premesse e conclusioni, esiste solo una ed una sola relazione di un determinato tipo definito relazione di probabilità;  e questo se, in qualsiasi caso dato, la relazione sia di grado α, dalla totale convinzione nelle premessa, noi possiamo, se siamo razionali, pervenire ad un grado di convinzione α nella conclusione.

Prima di criticare questo punto di vista, potrebbe forse essermi consentito di segnalare un evidente e facilmente correggibile difetto nella sua definizione. Quando viene detto che il grado della relazione di probabilità è la stessa del grado di convinzione che la giustifica, sembra essere presupposto che sia i rapporti di probabilità, da un lato, ed i gradi di convinzione, dall’altro possano essere naturalmente espressi in termini numerici e quindi che il numero che esprime o misura il rapporto di probabilità è lo stesso che esprime l’appropriato grado di convinzione. Ma se, come sostiene Keynes, queste cose non sono sempre esprimibili con i numeri, allora non possiamo porre la sua affermazione che il grado dell’una  sia lo stesso dell’altra come una semplice interpretazione, ma si deve supporre che pensi soltanto che esista una corrispondenza biunivoca tra i rapporti di probabilità e i gradi di convinzione che li giustificherebbe. Questa corrispondenza deve conservare evidentemente le relazioni di maggiore e minore, e rendere la varietà delle relazioni di probabilità e quella di gradi di convinzione simili nel senso di Russell. Penso che sia un peccato che Keynes non ha visto questo chiaramente, perché l’esattezza di questa corrispondenza avrebbe fornito materia abbastanza degna per il suo scetticismo come fece sulla misura numerica dei rapporti di probabilità. Infatti alcuni dei suoi argomenti contro la loro misura numerica sembra si applichino abbastanza altrettanto bene contro la loro esatta corrispondenza con i gradi di convinzione; per esempio, sostiene che se i tassi di assicurazione corrispondessero a soggettivi, cioè reali, gradi di convinzione, questi non sarebbero razionalmente determinati, e non potremmo dedurre che le relazioni di probabilità possano essere misurate allo stesso modo. Si potrebbe sostenere che la vera conclusione in tal caso non sarebbe che, come pensa Keynes, alla relazione non -numerica di probabilità  corrisponda un non-numerico grado di convinzione razionale, ma che i gradi di convinzione, che sarebbero sempre numerici, non hanno una corrispondenza biunivoca con le relazioni di probabilità che le giustificano. Perché è, suppongo, concepibile che i gradi di convinzione possano essere misurati da uno psicogalvanometro o qualche strumento simile, e Keynes difficilmente desidererebbe che da ciò seguirebbe che i rapporti di probabilità possano essere per derivazione misurati con le misure delle convinzioni che li giustificano.

1 J.M. Keynes, A Treatise on Probability (1921).

Ma torniamo a una critica più fondamentale delle opinioni di Keynes, che è quell’ovvietà che realmente non sembra che esistano oggetti come i rapporti di probabilità che lui descrive. Lui suppone che, comunque in alcuni casi, possano essere percepiti; ma per quanto mi riguarda mi sento fiducioso che questo non è vero. Io non li percepisco, e se devo essere convinto che esistono, deve essere fatto con ragione; inoltre ho avvedutamente il sospetto che anche gli altri non li percepiscano, perché sono in grado di raggiungere un così piccolo accordo come con quello di essi che si riferisce ad ogni due date proposizioni. Tutto quello che sembra di sapere su di questo sono alcune proposizioni generali, le leggi di addizione e moltiplicazione; è come se tutti conoscessero le leggi della geometria, ma nessuno potesse dire se ogni determinato oggetto fosse rotondo o quadrato; e trovo difficile immaginare come una massa così grande di conoscenza generale possa essere combinata con una così esigua riserva di fatti particolari. E’ vero che su alcuni casi particolari vi sia un accordo, ma questi in qualche modo, paradossalmente, sono sempre immensamente complicati; siamo tutti d’accordo che la probabilità di una moneta lanciata sia testa è 1/2, ma nessuno di noi può dire esattamente quale è la prova che costituisce l’altro termine per la relazione di probabilità intorno alla quale noi stiamo facendo valutazioni. Se, invece, prendiamo le più semplici  coppie possibili di proposizioni come ‘Questo è rosso’ e ‘Questo è blu’ o ‘Questo è rosso’ e ‘Quello è rosso’, le cui relazioni logiche dovrebbero essere le relazioni sicuramente più facili da osservare, nessuno, credo, avrebbe la presunzione di essere sicuro di quale sia la relazione di probabilità che le collega. O, forse, si può pretendere di vedere la relazione, ma non saranno in grado di dire nulla su di essa con certezza, di affermare se sia più o meno di 1/3, o così via. Essi possono, naturalmente, dire che è incomparabile con qualsiasi rapporto numerico, ma una relazione su ciò che così poco può essere detto in modo veritiero sarebbe di scarso uso scientifico e sarebbe difficile convincere uno scettico della sua esistenza. Inoltre questo punto di vista è davvero un po’ paradossale, perché ogni persona che crede nell’induzione deve ammettere che tra ‘Questo è rosso’ come conclusione e ‘Questo è rotondo’, insieme a un miliardo di proposizioni della forma ‘a è rotondo e rosso ‘come prova, c’è una relazione di probabilità finita; ed è difficile supporre che come abbiamo accumulato casi di prova questi sono improvvisamente ad un punto, ad esempio dopo 233 prove, nel quale la relazione di probabilità diventa finita e così comparabile con qualche rapporto numerico.

Mi sembra che se prendiamo le due proposizioni ‘a è rosso’, ‘b è rosso’, non possiamo discernere più di quattro semplici relazioni logiche tra di esse, vale a dire l’identità di forma, identità di predicato, la diversità del soggetto, e l’indipendenza logica di significato. Se qualcuno mi chiedesse quale probabilità darei all’una e all’altra, non dovrei cercare di rispondere meditando sulle proposizioni e cercando di discernere una relazione logica tra di esse, dovrei, piuttosto, provare ad immaginare che una di quelle sia  tutto quello che sapevo, e ad indovinare quale grado di convinzione dovrei avere poi nell’altra. Se io sono stato in grado di fare questo, potrei senza dubbio ancora non essere contento con questo, ma potrei dire ‘Questo è quello che penserei, ma, naturalmente, io sono solo un pazzo ‘e procederei a considerare ciò che un uomo saggio potrebbe pensare e chiamare questo il grado di probabilità. Io discuterò più tardi questo tipo di autocritica, quando svilupperò la mia teoria; tutto ciò che voglio sottolineare qui è che nessuno che valuta un grado di probabilità prende in considerazione semplicemente  le due proposizioni che si suppone essere correlate con esso; egli sempre considera, tra l’altro il suo proprio grado di convinzione effettivo o ipotetico. Questa osservazione mi sembra essere confermata dalla osservazione del mio comportamento; e per essere l’unico modo di rendere conto del fatto che tutti possiamo fornire stime di probabilità in casi presi dalla vita reale, ma siamo del tutto incapaci di farlo nei casi logicamente più semplici in cui, fosse la probabilità una relazione logica, sarebbe più facile da discernere.

Un altro argomento contro la teoria di Keynes può, credo, essere tratto dalla sua incapacità di aderire ad essa coerentemente anche nella discussione principi primi. C’è un passaggio nel suo capitolo sulla misura della probabilità che recita quanto segue: “La probabilità, vedi capitolo 11 (§ 12), relativa in un certo senso ai principi della ragione umana. Il grado di probabilità, che è razionale per noi prendere in considerazione, non ha la pretesa di una intuizione logica perfetta, ed è relativa in parte alle proposizioni secondarie che in realtà conosciamo; e non dipende se una visione logica più perfetta è o non è concepibile. E’ il grado di probabilità a cui conducono questi processi logici, di cui le nostre menti sono capaci; o, nel linguaggio del capitolo II, che quelle proposizioni secondarie giustificano, che in realtà conosciamo. Se non assumiamo questo punto di vista sulla probabilità, se non la limitiamo in questo modo e lo rendiamo, fino a questo punto, relativamente ai poteri umani, siamo del tutto alla deriva nell’ignoto; perché non possiamo mai sapere quale grado di probabilità sarebbe giustificato dalla percezione di relazioni logiche che noi siamo, e sempre dobbiamo essere, incapaci di comprendere.” 1

Questo passaggio mi sembra abbastanza inconciliabile con il punto di vista che Keynes adotta dappertutto tranne in questo e un altro passo simile. Perché egli sostiene in generale che il grado di convinzione che siamo giustificati nel mettere alla conclusione di un argomento è determinato da quale relazione di probabilità unisce tale conclusione alle nostre premesse. C’è un solo rapporto di questo tipo e di conseguenza una sola vera pertinente proposizione secondaria, che, ovviamente, posso o non posso conoscere, ma che è necessariamente indipendente dalla mente umana. Se noi non lo sappiamo, non lo sappiamo e non possiamo dire quanto dovremmo credere nella conclusione. Ma spesso, egli suppone, che noi lo sappiamo;  i rapporti di probabilità non sono quelli che siamo incapaci di comprendere. Ma su questo punto di vista l’argomento del passo sopra citato non ha alcun significato: le relazioni che giustificano le probabili convinzioni sono relazioni di probabilità, e non ha senso dire di loro che sono giustificate da relazioni logiche che noi siamo, e dobbiamo sempre essere, incapaci di comprendere.

Il significato del passaggio per il nostro scopo attuale sta nel fatto che esso sembra presupporre un diverso punto di vista sulla probabilità, in cui rapporti di probabilità indefinibili non giocano alcun ruolo, ma in cui il grado di convinzione razionale dipende da una varietà di relazioni logiche. Per esempio, ci potrebbe essere tra la premessa e la conclusione la relazione che la premessa era il prodotto logico di un migliaio esempi di una generalizzazione la conclusione della quale era un altro esempio, e questa relazione, che non è un rapporto di probabilità indefinibile ma definibile in termini di logica ordinaria e così facilmente riconoscibile, potrebbe giustificare un certo grado di convinzione nelle conclusioni da parte di uno che credesse nelle premesse. Dovremmo quindi avere una varietà di ordinarie relazioni logiche che giustificano lo stesso o gradi diversi di convinzione. Dire che la probabilità di a dato h era così e così significherebbe che tra a e h esiste una relazione che giustifichi tale-e-tale grado di convinzione. E da questo punto di vista sarebbe un vero e proprio punto essenziale che la relazione in questione non deve essere una relazione che la mente umana sia incapace di comprendere.

1 p. 32, corsivo nel testo.

Questo secondo punto di vista della probabilità come dipendente da relazioni logiche, ma non per sé una nuova relazione logica mi sembra più plausibile della usuale teoria di Keynes; ma questo non vuol dire che mi sento affatto propenso a concordare con lui. Questo richiederebbe  l’idea un po ‘oscura di una relazione logica che giustifica un  grado di convinzione, che non vorrei accettare come indefinibile perché non sembra essere del tutto un concetto chiaro e semplice. Inoltre è difficile dire quali relazioni logiche giustificano quali gradi di convinzione, e perché; qualsiasi decisione in questo senso sarebbe arbitraria, e porterebbe ad una logica di probabilità costituita da una moltitudine di cosiddetti “necessari” fatti, come la logica formale secondo il punto di vita di  Chadwick sulle constanti logiche. 1 Al contrario io penso sia molto meglio cercare una spiegazione di questa ‘necessità sul modello di lavoro di Wittgenstein, che ci permette di vedere chiaramente in quale preciso senso e perché le proposizioni logiche sono necessarie, e in maniera generale perché il sistema della logica formale è composto di  proposizioni di cui è composto, e quale è la sua caratteristica comune. Come la scienza naturale cerca di spiegare e calcolare i fatti della natura, così la filosofia dovrebbe cercare, in un certo senso, di spiegare e calcolare i fatti di logica; un compito ignorato dalla filosofia che respinge questi fatti come non calcolabili e in un senso indefinibile ‘necessari’.

Qui mi propongo di concludere questa critica della teoria di Keynes, non perché non ci siano altri aspetti nei quali sembra offrire il fianco ad obiezioni, ma perché spero che quello che ho già detto sia sufficiente a dimostrare che non è così del tutto soddisfacente da rendere inutile qualsiasi tentativo di trattare la teoria da un punto di vista piuttosto diverso.

J.A. Chadwick “Logical Constants”, Mind, 1927.

(3) GRADI DI CONVINZIONE

L’oggetto della nostra indagine è la logica della convinzione parziale, e non credo che possiamo affrontarla a meno che abbiamo almeno una nozione approssimativa di ciò che sia la convinzione parziale, e come, se non altro, può essere misurata. Non sarà molto illuminante sentirsi dire che in certe circostanze sarebbe razionale credere una proposizione nella misura di 2/3, a meno che sappiamo che cosa significa questo tipo di convinzione in ciò. Dobbiamo quindi cercare di sviluppare un metodo puramente psicologico della misura della convinzione. Non è abbastanza misurare la probabilità; al fine di assegnare correttamente la nostra convinzione alla probabilità dobbiamo anche essere in grado di misurare la nostra convinzione. E’ comune opinione che la convinzione e altre variabili psicologiche non siano misurabili, e se questo fosse vero la nostra indagine sarebbe vana;  e così sarebbe tutta la teoria della probabilità concepita come la logica della parziale convinzione; perché se la frase ‘una convinzione di due terzi di certezza’ fosse priva di significato, un calcolo il cui unico obiettivo sia imporre tali convinzioni sarebbe anche privo di senso. Quindi a meno che non siamo disposti a rinunciare a tutta la faccenda come un cattivo lavoro noi siamo tenuti a sostenere che le convinzioni possono in qualche misura essere misurate. Se dovessimo seguire l’analogia di Keynes nel trattare le probabilità dovremmo dire che alcune convinzioni sarebbero misurabili e altre no; ma questa probabilmente non mi sembra essere un considerazione corretta della questione: non vedo come si possa dividere nettamente le convinzioni in quelle che hanno una posizione nella scala numerica e quelli che non l’hanno. Ma penso che le convinzioni si differenziano in misurabilità nei seguenti due modi. In primo luogo, alcune convinzioni  possono essere misurate più accuratamente di altre; e, in secondo luogo, la misurazione delle convinzioni è abbastanza certamente un processo ambiguo che conduce ad una risposta variabile a seconda di come esattamente la misurazione viene effettuata. Il grado di convinzione a questo proposito è come l’intervallo di tempo tra due eventi; prima di Einstein si considerava che tutti i metodi ordinari di misura di un intervallo di tempo avrebbero dovuto portare allo stesso risultato se effettuata correttamente. 1  Einstein ha dimostrato che questo non era il caso; e l’intervallo di tempo non può più essere considerato come una nozione precisa, ma deve essere abbandonato in tutte le indagini precise. Tuttavia, l’intervallo di tempo e il sistema newtoniano sono sufficientemente accurati per molti scopi e più  facili da applicare. Cercherò di argomentare in seguito che il grado di una convinzione è come un intervallo di tempo; non ha un preciso significato a meno che si specifichi più precisamente come debba essere misurato. Ma per molti scopi possiamo supporre che i modi alternativi di misurarlo portano allo stesso risultato, anche se questo è solo approssimativamente vero. Le discrepanze risultanti sono più evidenti in connessione con alcune convinzioni che con altre, e queste dunque appaiono meno misurabili. Entrambi questi tipi di carenze nella misurabilità, dovuti rispettivamente alla difficoltà di ottenere una misura sufficientemente esatta e ad una importante ambiguità nella definizione del processo di misura, si verificano anche nella fisica e così non sono difficoltà peculiari del nostro problema; quello che è peculiare è che è difficile formulare qualsiasi idea di come la misurazione debba essere effettuata, come l’unità di misura si debba ricavare, e così via. Consideriamo quindi ciò che è implicito nella misurazione delle convinzioni. Un sistema soddisfacente deve in primo luogo assegnare ad ogni convinzione una grandezza o misura avente una precisa posizione in un ordine di grandezza; convinzioni che siano dello stesso grado di convinzione devono  avere la stessa misura dell’una e dell’altra, e così via. Naturalmente questo non può essere realizzato senza introdurre una certa quantità di ipotesi o invenzioni. Anche in fisica non si può sostenere che oggetti che sono uguali a qualche cosa siano uguali l’uno all’altro senza porre ‘uguale’ non con il significato ‘percettibilmente uguale’, ma come un’invenzione o una relazione ipotetica. Non voglio discutere la metafisica o epistemologia di questo processo, ma solo  sottolineare che se è ammissibile in fisica, sarà anche ammissibile in psicologia. La semplicità logica caratteristica delle relazioni trattate in una scienza non viene ottenuta per sua sola natura senza alcuna mescolanza con l’invenzione. Ma il costruire una tale serie ordinata di gradi non è tutto l’insieme del nostro lavoro; dobbiamo anche assegnare valori numerici a questi gradi in qualche modo intelligibile. Ovviamente possiamo facilmente spiegare che indichiamo piena convinzione con 1, la convinzione piena nell’opposto con 0, e le uguali convinzioni in una proposizione e la sua contraddizione con 1/2. Ma non è così semplice dire cosa si intende con una convinzione di certezza pari a 2/3, o che una convinzione in una proposizione sia due volte più forte che la sua contraddizione. Questa è la parte più difficile del lavoro, ma è assolutamente necessaria; perché noi calcoliamo le probabilità numeriche, e se queste corrispondono al grado di convinzione noi dobbiamo scoprire qualche modo definito di assegnare numeri ai gradi di convinzione. In fisica spesso si attribuiscono i numeri scoprendo un processo fisico di addizione 1: il numero per la misura di lunghezze non viene assegnato arbitrariamente soggetto soltanto alla condizione che una maggiore lunghezza deve avere una misura più grande; noi la determiniamo ulteriormente stabilendo un significato fisico per l’addizione; la lunghezza ottenuta mettendo insieme due date lunghezze deve avere per la sua misura la somma delle singole misure. Un sistema di misura in cui non vi è nulla che corrisponde a questo viene immediatamente riconosciuto come arbitrario, per esempio la scala di durezza 1 di Mohs in cui 10 è assegnato arbitrariamente al diamante, il materiale più duro conosciuto, 9 al successivo più duro, e così via.

1 Vedi N. Campbell, Physics The Elements (1920), p.277.

1 Ibid., p.271.

Dobbiamo quindi trovare un processo di addizione per i gradi di convinzione, o un qualche  sostituto a questo che sia ugualmente adeguato a definire una scala numerica. Questo è il nostro problema: come si risolve? Ci sono, credo, due modi da cui possiamo iniziare. Possiamo, in primo luogo, supporre che il grado di una convinzione sia qualcosa di percepibile da chi lo possiede; ad esempio che le convinzioni differiscano nell’intensità della sensazione da cui sono accompagnate, che potrebbe essere chiamata un sentimento di convinzione o sensazione di convincimento, e che per grado di convinzione intendiamo l’intensità di questo sentimento. Questo punto di vista sarebbe molto scomodo, perché non è facile attribuire numeri all’intensità dei sentimenti; ma a parte questo mi sembra palesemente falso, perché le convinzioni che abbiamo più fortemente sono spesso accompagnate praticamente affatto da nessuna sensazione;  nessuno sente fortemente cose che dà per scontate. Siamo quindi condotti alla seconda ipotesi che il grado di una convinzione sia una proprietà causale di ciò, che possiamo esprimere vagamente come il campo di applicazione in cui siamo pronti ad agire con esso. Questa è una generalizzazione del noto punto di vista, che la differenza di convinzione sta nella sua efficacia causale, che viene discusso da Russell nella sua Analysis of Mind. Egli in quell’opera la respinge per due motivi, uno dei quali sembra completamente mancare il punto. Egli sostiene che nel corso della serie dei pensieri, noi concepiamo molte cose che non danno luogo ad azione. Questa obiezione, tuttavia, è vicina a cogliere nel segno, in quanto non si afferma che una convinzione sia un’idea che effettivamente porta ad una azione, ma che porterebbe all’azione in opportune circostanze; proprio come una zolletta di arsenico è detta velenosa, non perché in realtà ha ucciso o ucciderà qualcuno, ma perché potrebbe uccidere chiunque la mangiasse. Il secondo argomento di Russell, tuttavia, è più arduo. Egli fa notare che non è possibile supporre che le convinzioni differiscano dalle altre idee solo per i loro effetti, perché altrimenti se fossero identiche anche i loro effetti sarebbero identici. Questo è perfettamente vero, ma può ancora restare il caso che la natura della differenza tra le cause sia o completamente sconosciuta o molto vagamente nota, e che quello di cui vogliamo parlare sia la differenza tra gli effetti, che è immediatamente osservabile e rilevante. Non appena noi consideriamo una convinzione quantitativamente, questo mi sembra l’unico punto di vista che possiamo avere su di essa. Si potrebbe giustamente considerare che la differenza tra credere e non credere stia nella presenza o assenza di sentimenti introspettivamente. Ma quando cerchiamo di conoscere quale sia la differenza tra credere con più certezza e credere con meno certezza, non possiamo più considerarlo come definibile nell’avere più o meno di una certa sensazione osservabile; almeno io personalmente non sono in grado di riconoscere sentimenti di questo genere. Mi sembra che la differenza si trovi in fino a che punto dovremmo agire in base a queste convinzioni: questo può dipendere dal grado di qualche sensazione o sensazioni, ma non so esattamente quali sensazioni e non penso che sia indispensabile che le conosciamo. Proprio la stessa cosa si trova nella fisica; si è trovato che un cavo che collega lastre di zinco e rame poste in un acido devia un ago magnetico posto nelle sue vicinanze. Di conseguenza, se l’ago viene più o meno deviato si dice che il filo elettrico porta una corrente più o meno grande. La natura di questa ‘corrente’ può essere solo ipotizzata: quello che viene osservato e misurato sono semplicemente i suoi effetti. Si può senza dubbio obiettare che noi sappiamo con quanta forza crediamo in oggetti, e che possiamo conoscere questo solo se siamo in grado di misurare la nostra convinzione per introspezione. Questo non mi sembra necessariamente vero;  in molti casi, credo, il nostro giudizio sulla forza della nostra convinzione è realmente su come agiremmo in ipotetiche circostanze. Si potrebbe rispondere che possiamo solo dire come agiremmo osservando l’attuale sensazione di convincimento che determina il modo in cui agiremmo; ma ancora una volta dubito la cogenza dell’argomento. E’  possibile che ciò che determina il modo in cui agiremmo ci determina anche, direttamente o indirettamente ad avere una corretta opinione su come agiremmo,  senza che ciò mai giunga nella consapevolezza. Supponiamo, tuttavia, che mi sbagli su questo e che possiamo decidere per introspezione la natura della convinzione, e misurarne il grado; pertanto, io sosterrei, il tipo di misura di convinzione con cui la probabilità è interessata non è di questo tipo, ma è una misura della convinzioni su qualche base di azione. Questo io penso si possa mostrare in due modi. In primo luogo, considerando la scala di probabilità tra 0 e 1, e il tipo di modo di usarlo, vedremo che è molto appropriato per la misura della convinzione come base di un’azione, ma in nessun modo correlato alla misura di una introspettiva sensazione. Perché le unità nei termini in cui  sono misurate tali sensazioni o sentimenti sono sempre, penso, differenze che sono appena percettibili: non c’è altro modo di ottenere tali unità. Ma non vedo alcuna ragione per supporre che l’intervallo tra una convinzione di grado 1/3 e una di grado 1/2 sia composto da alquante appena percettibili modifiche così come quella tra una di 2/3 ed una di 5/8, o che questa scala basata su appena percettibili differenze non avrebbe alcuna semplice relazione con la teoria della probabilità. D’altra parte la probabilità di 1/3 è chiaramente correlata al tipo di convinzione che porterebbe ad una scommessa di 2 a 1, e verrà illustrato di seguito come generalizzare questo rapporto in modo da applicarlo ad una azione in generale. In secondo luogo, gli aspetti quantitativi di convinzioni come base di azione sono evidentemente più importanti dell’intensità di una sensazione di convinzione. Questi ultimi sono senza dubbio interessanti, ma possono essere molto variabile da individuo a individuo, e il loro interesse pratico è interamente dovuto alla loro posizione di ipotetiche cause di convinzione per qualche fondamento di una azione. E’ possibile che qualcuno dirà che la misura in cui dovremmo agire sulla base di una convinzione in opportune circostanze è un oggetto ipotetico, e quindi non soggetto a misurazione. Ma dire questo è solo il rivelare l’ignoranza delle scienze fisiche che costantemente si occupano di misurare quantitativi ipotetici; per esempio, l’intensità elettrica in un dato punto è la forza che agirebbe su una carica unitaria se fosse messa in un dato luogo. Cerchiamo ora di trovare un metodo di misurare le convinzioni come fondamento di azioni possibili. E’ chiaro che noi siamo interessati all’intenzione piuttosto che alle convinzioni realizzate; vale a dire, non con le convinzioni al momento in cui pensiamo ad esse, ma alle mie convinzioni come la mia convinzione che la terra è rotonda, a cui raramente penso, ma che guiderebbe la mia azione in ogni caso in cui fosse rilevante. Il vecchio consolidato modo di misurare la convinzione di una persona è quello di proporre una scommessa, e vedere quale sarebbe la più bassa posta che egli accetterebbe. Considero questo metodo fondamentalmente valido, ma ha il difetto di non essere abbastanza generale, e di essere necessariamente inesatto. E’ inesatto parzialmente  a causa del decrescere dell’utilità marginale del denaro, in parte perché una persona può avere entusiasmo o riluttanza a scommettere, perché o gode o detesta questa emozione o per qualsiasi altro motivo, ad esempio, per scrivere un libro. La difficoltà è simile a quella di separare due differenti forze co-operanti. Inoltre, la proposta di una scommessa può alterare inevitabilmente lo stato della sua opinione; così come non potremmo sempre misurare l’intensità elettrica con una effettiva introduzione di una carica elettrica e osservando a quale forza essa è soggetta, perché l’introduzione di una carica cambia la distribuzione che si vuole misurare. Al fine quindi di costruire una teoria quantitativa della convinzione che sarebbe insieme generale ed più esatta, mi propongo di prendere come fondamento una teoria psicologica generale, che è ormai universalmente abbandonata, ma risulta comunque, credo, abbastanza vicina alla verità in una sorta di casi in cui noi siamo più interessati. Mi riferisco alla teoria che noi agiamo nel modo che pensiamo che più probabilmente realizzi gli oggetti del nostro desiderio, in modo che le azioni di una persona sono completamente determinate dai suoi desideri e dalle sue opinioni. Questa teoria non può risultare adeguata a tutti i fatti, ma mi sembra una utile approssimazione alla verità, soprattutto nel caso della nostra vita cosciente o professionale, ed è implicata in grande accordo con il nostro pensiero. Si tratta di una teoria semplice e una teoria che molti psicologi ovviamente gradirebbero mantenere attraverso l’introduzione di desideri inconsci e opinioni inconsce in al fine di renderla più in armonia con i fatti. Non mi sento di giudicare fino a che punto tali ipotesi possano ottenere i risultati richiesti: io solo l’affermo per ciò che segue da una verità approssimativa, o la verità in relazione a questo sistema artificiale di psicologia, che, come la meccanica newtoniana può, io credo, ancora essere utilizzata con profitto anche se è noto per essere errata. Si deve rilevare che questa teoria non deve essere identificata con la psicologia degli Utilitaristi, in cui il piacere ha una posizione dominante. La teoria che propongo di adottare è che cerchiamo le cose che vogliamo, che possono essere per nostro o di altrui piacere, o una qualsiasi altra cosa, e le nostre azioni si verificano per come riteniamo più probabile ottenere questi beni. Ma questa non è una precisa formulazione, perché una precisa formulazione della teoria può essere fatta solo dopo aver introdotto la nozione quantitativa di convinzione. Chiamiamo le cose che una persona desidera in definitiva, ‘beni’, e assumiamo in un primo momento che siano numericamente misurabili e additivi. Vale a dire che se lui preferisce di per sé un’ora di nuoto ad un’ora di lettura, egli preferirà due ore di nuoto a un’ora di nuoto e ad un’ora di lettura. Questo è ovviamente assurdo nel caso specifico, ma questo potrebbe essere solo perché il nuoto e la lettura non sono beni fondamentali, e perché non possiamo immaginare una seconda ora di nuoto esattamente simile alla prima, a causa dell’affaticamento, ecc. Cominciamo col supporre che il nostro soggetto non ha dubbi su nulla, ma sicure opinioni su tutte le proposizioni. Allora possiamo dire che sempre sceglierà il corso di azioni che porteranno secondo la sua opinione alla massima somma di bene. Va sottolineato che in questo esempio bene e male non sono da intendersi in nessun senso etico, ma semplicemente per indicare quello per cui una persona prova desiderio o avversione. Il problema quindi si pone su come dobbiamo modificare questo semplice sistema per tener conto dei diversi gradi di certezza nelle sue convinzioni. Suggerisco che si introduca come legge psicologica che il suo comportamento sia governato da quello che viene chiamato la speranza matematica; vale a dire che, se p è una proposizione su cui egli ha dubbi, ogni bene o male per la cui realizzazione p è a suo avviso una condizione necessaria e sufficiente entrerà nei suoi calcoli moltiplicata per quella frazione, che verrebbe chiamata il ‘grado della sua convinzione in p’. Definiamo così il grado di convinzione in un modo che presuppone l’uso della speranza matematica. Questo si può porre in un modo diverso. Supponiamo che il suo grado di convinzione in p sia m/n; allora la sua azione sarebbe tale come se egli dovesse scegliere di ripeterla esattamente n volte, in m volte delle quali p sarebbe vera, e nelle altre falsa. [Qui sarebbe necessario supporre che in ciascuna delle n volte egli non abbia memoria delle precedenti.] Questo può anche essere preso come una definizione del grado di convinzione, e può essere facilmente considerato come equivalente alla definizione precedente. Diamo un esempio del tipo di casi che potrebbero verificarsi. Io sono ad un bivio e non conosco la strada, ma io piuttosto penso che una delle due strade è quella giusta. Propongo quindi di andare in quella direzione, ma tengo gli occhi aperti per qualcuno a cui chiedere; se adesso vedo qualcuno a mezzo miglio di distanza oltre i campi, se devio per chiedere a lui dipenderà dal relativo disagio di andare fuori dalla mia strada per attraversare i campi o di proseguire sulla strada sbagliata se si tratta della strada sbagliata. Ma dipenderà anche da come sono sicuro che ho ragione; e chiaramente più Io sono sicuro di questo minore sarà la distanza che sarei disposto a percorrere dalla strada (in cui mi trovo) per controllare la mia opinione. Propongo pertanto di utilizzare la distanza che sarei disposto a percorrere per chiedere, come misura della fiducia nella mia opinione; e quello che ho detto sopra spiega come questo deve essere fatto. Possiamo iniziare come segue: supponiamo che l’inconveniente di percorrere x iarde per chiedere sia f(x), il vantaggio  di arrivare alla destinazione giusta sia r, quello di arrivare a quella sbagliata w. Quindi se proprio fossi disposto ad andare ad una distanza d per chiedere, il grado della mia convinzione che io sono sulla strada giusta sarebbe data da

Schermata 2013-12-27 alle 18.29.37

 

 

 

Per una tale azione ci sarebbe uno che mi pagherebbe per farla, se avessi dovuto agire nello stesso modo n volte, in np delle quali ero sulla strada giusta mentre nelle altre no.

Per il bene totale risultante dal non chiedere ogni volta

= npr + n(1-p) w

= nw + np (r – w)

che risulta dal chiedere ad una distanza x ogni volta = nr- nf(x) [io so che vado sempre nella strada giusta]

Questo è più grande dell’espressione precedente, a condizione che

f (x) <(r – w) (1-p),

∴ la distanza critica d è collegata con p, il grado di convinzione, con la relazione f (d) = (r – w) (1-p) o

Schermata 2013-12-27 alle 18.29.37

come affermato sopra.

 

 

E’ facile vedere che questo modo di misurare la convinzione, fornisce risultati in accordo con i concetti ordinari; comunque per estensione la piena convinzione è indicata con 1, piena convinzione in negativo con 0, e pari convinzione tra due con 1/2. Inoltre, ammette la validità della scommessa come mezzo per misurare le convinzioni. Proponendo una scommessa su p diamo al soggetto una possibile condotta di azione da cui risulterebbe tanto supplementare bene per lui se p fosse vero e tanto maggiore male se p è falso. Supponendo la scommessa fosse tra bene e male invece che in denaro, egli scommetterebbe per qualsiasi migliore probabilità di quella che corrisponde al suo stato di convinzione; in realtà il suo stato di convinzione è misurato dalla probabilità che egli precisamente assumerà; ma questo è viziato, come già spiegato, per amore o odio di emozione, e per il fatto che la scommessa è in denaro e non in bene e male. Poiché è universalmente riconosciuto che il denaro ha un’utilità marginale decrescente, se si considerano le scommesse in denaro, è evidente che esse devono essere per quanto possibile di piccola posta. Ma poi di nuovo la misura è guastata introducendo il nuovo fattore di riluttanza a preoccuparsi per inezie.

Vediamo ora di scartare l’ipotesi che il bene sia additivo e immediatamente misurabile, e cerchiamo di elaborare un sistema con meno ipotesi possibili. Per cominciare supponiamo, come prima, che il nostro soggetto ha certe convinzioni su tutto; poi egli agirà in modo che ciò che crede essere le conseguenze complessive della sua azione siano le migliore possibili. Se poi avessimo il potere  dell’Onnipotente, e potessimo convincere il nostro soggetto del nostro potere, potremmo, offrendogli opzioni, scoprire come ha posto in ordine di merito tutti i possibili andamenti del mondo. In questo modo tutti i mondi possibili verrebbero posti in ordine di valore, ma non avremmo un modo esatto di rappresentarli con i numeri. Non avrebbe alcun significato l’affermazione che la differenza di valore tra α e β sia pari a quella tra γ e δ. [Qui e altrove usiamo lettere greche per rappresentare le diverse possibili totalità di eventi tra cui il nostro soggetto sceglie – le definitive organiche unità.]

Supponiamo ora che il soggetto sia in grado di dubitare; allora potremmo provare il suo grado di convinzione in diverse proposizioni facendogli offerte del tipo seguente. Preferiresti avere un mondo α in qualsiasi evento; o un mondo β se p è vero, e un mondo γ se p è falsa? Se, allora, egli fosse certo che che p fosse vero, egli semplicemente confronterebbe α e β e sceglierebbe tra questi come se non ci fossero condizioni fissate; ma se dubitasse della sua scelta non potrebbe decidere in modo così semplice. Propongo di stabilire assiomi e definizioni in merito ai principi che regolano scelte di questo tipo. Questo è, naturalmente, una versione molto schematica della situazione nella vita reale, ma è, credo, più facile da prendere in considerazione in questa forma.

Vi è innanzitutto una difficoltà che deve essere affrontata; le proposizioni p, come nel caso di cui sopra che vengono utilizzate come condizioni nelle varianti offerte possono essere tali che la loro verità o falsità è un oggetto del desiderio per il soggetto. Questo scoprirà che complica il problema, e noi dovremo assumere che ci sono proposizioni per le quali questo non è il caso, che noi chiameremo eticamente neutrali. Più precisamente una proposizione atomica p è detta eticamente neutrale se due mondi possibili che differiscono solo in relazione alla verità di p sono sempre di pari valore; e una proposizione non-atomica p è detta eticamente neutrale se tutti suoi argomenti veri 1 sono eticamente neutrali. 1 Assumo qui la teoria delle proposizioni di Wittgenstein; può essere possibile dare una definizione equivalente nei termini di qualsiasi altra teoria.

Cominciamo con la definizione del grado di convinzione 1/2 in una proposizione eticamente neutrale. Si dice che il soggetto ha un grado di convinzione 1/2 in una certa proposizione p se non ha preferenze tra le opzioni (1), α se p è vero, β se p è falsa, e (2) α se p è falsa, β se p è vera, ma ha semplicemente una preferenza tra α e β. Supponiamo per un assioma che se questo è vero per qualche coppia α, β è vero per tutte le coppie tali. 1 Ciò risulta rozzamente definendo il grado di convinzione 1/2 come quel grado di convinzione che porta all’indifferenza fra lo scommettere in un modo e scommettere nell’altro per la stessa puntata.

Il grado di convinzione 1/2 così definito può essere usato per misurare i valori numericamente nel modo seguente. Dobbiamo spiegare cosa si intende per la differenza di valore tra α e β essere uguale a quello tra γ e δ; e definiamo questo per indicare che, se p è una proposizione eticamente neutrale creduta con il grado 1/2, il soggetto non ha alcuna preferenza tra le opzioni (1) α se p è vera, δ se p è falsa, e (2) β se p è vera, γ se p è falsa.

Questa definizione può costituire la base di un sistema di misurazione dei valori nel modo seguente: –

Chiamiamo qualsiasi insieme di tutti i mondi ugualmente preferibile a un mondo dato un valore: supponiamo che, se il mondo α è preferibile a β qualsiasi mondo con lo stesso valore di α è preferibile a qualsiasi mondo con lo stesso valore di β e possiamo dire che il valore di α è maggiore di quella di β. Questa relazione ‘maggiore di’ ordina i valori in una serie. Useremo α d’ora in poi sia per il mondo sia per suo valore.

Assiomi.

(1) Vi è una proposizione p eticamente neutrale creduta con grado 1/2.

(2) Se p, q sono proposizioni cosiffatte anche l’opzione

α se p, δ se non-p è equivalente a β se p, γ se non-p

allora α se q, δ se non-q è equivalente a β se q, γ se non-q.

Definizione Nel caso di cui sopra si dice αβ = γδ.

Teoremi.  Se αβ=γδ

allora βα=δγ, αγ=βδ, γα=δβ

1 α e β si suppongono così indefinite da essere compatibili sia con p sia con non-p.

(2a) Se αβ = γδ, allora α> β è equivalente a γ> δ

e α = β è equivalente a γ = δ

(3) Se l’opzione A è equivalente all’opzione B e B a C, allora A è equivalente a C.

Teorema. Se αβ = γδ e βη = ζγ

allora  αη = ζδ

(4) Se αβ = γδ, γδ = ηζ, allora  αβ = ηζ.

(5) (α, β, γ). E ! (ικ) (ακ = βγ)

(6) (α, β). E ! (ικ) (ακ = κβ)

(7) Assioma di continuità: – Qualsiasi progressione ha un limite (ordinale).

(8) Assioma di Archimede.

Questi assiomi consentono ai valori di essere correlati biunivocamente con numeri reali in modo che se α1 corrisponde a α, ecc

αβ = γδ . ≣ . α1 – β1 = γ1 – δ1.

D’ora in poi useremo α anche per il correlato numero reale α1.

Avendo così definito un metodo di misurazione del valore possiamo ricavare un modo per misurare la convinzione in generale. Se l’opzione di α certa è indifferente con quella di β, se p è vero e γ se p è falso 1, possiamo definire il grado di convinzione del soggetto in p come il rapporto della differenza tra α e γ sulla differenza tra β e γ; che si deve supporre uguale per tutte le α, β e γ che soddisfano le condizioni. Questo valore grossolanamente per definire il grado di convinzione in p per la probabilità per cui il soggetto scommetterebbe su p, essendo la scommessa gestita nei termini di differenza di valori come definiti. La definizione si applica solo alla convinzione parziale e non include certe convinzioni; perché la convinzione di grado 1 in p, α per certo è indifferente rispetto ad α se p e per ogni β  se non-p.

Qui β deve comprendere la verità di p, γ la sua falsità; p non deve più essere eticamente neutrale. Ma dobbiamo assumere che esiste un mondo con qualsiasi valore assegnato in cui p è vero, e uno in cui p è falso.

Siamo anche in grado di definire una nuova idea molto utile – il ‘grado di convinzione in p dato q’. Questo non significa il grado di convinzione in ‘Se p allora q’, o quello in ‘p implica q’, o quella che il soggetto avrebbe in p se conoscesse q, o quella che dovrebbe avere. Esprime approssimativamente le probabilità per cui egli scommetterebbe ora su p, la scommessa sarebbe valida solo se q fosse vero. Tali scommesse condizionali venivano spesso fatte nel XVIII secolo.

Il grado di convinzione in p dato q si misura così. Supponiamo che un soggetto indifferente tra le opzioni (1) α se q vero, β se q falsa, (2) γ se p vera e q vero, δ se p falsa e q vero, β se q falso. Allora il suo grado di convinzione in p dato q è il rapporto delle differenza tra α e δ sulla differenza tra γ e δ, che dobbiamo supporre le stesse per qualsiasi, α, β, γ, δ che soddisfino le condizioni date. Questa non è la stessa cosa del grado con cui potrebbe credere in p, se credesse certo q; perché la conoscenza di q potrebbe per ragioni psicologiche alterare completamente il suo intero sistema di convincimento.

Ognuna delle nostre definizioni è stata accompagnata da un assioma di coerenza, e nella misura in cui ciò è falso, la nozione di grado di convinzione diviene non più valido. Questo ha una certa analogia con la situazione in materia di simultaneità discussa sopra.

Non ho sviluppato la logica matematica di questo nel dettaglio, perché questo, credo, sarebbe come avere un risultato con sette decimali che è valido con due soli decimali. La mia logica non può essere considerata come in grado di dare più di un di un certo tipo di procedimento che potrebbe funzionare.

Da queste definizioni e assiomi è possibile provare le leggi fondamentali della convinzione probabile (i gradi di convinzione sono compresi tra 0 e 1):

(1) Grado di convinzione in grado p + di convinzione in  Schermata 2013-11-24 alle 21.04.13    = 1

(2) Grado di convinzione in p  dato q + grado di convinzione in  Schermata 2013-11-24 alle 21.04.13  dato q = 1.

(3) Grado di credere in (p e q) = grado di convinzione in p x grado di convinzione in q dato p.

(4) Grado di convinzione in (p e q) + grado di convinzione in (p e Schermata 2013-08-23 alle 22.32.01   ) = grado di convinzione in p.

Le prime due sono di immediata comprensione. La (3) si dimostra come segue.

Sia il grado di convinzione in p = x, quello in q dato p = y.

Allora ξ certo ≣ ξ + (1-x) t se p vero, ξ – xt se p falso per qualsiasi t.

ξ + (1 – x) t se p vero ≣

ξ + (1 – x) + t (1 – y) u se ‘p e q’ veri,

ξ + (1 – x) t – yu se p vero e q falso;  per ogni u

Scegliamo u in modo che ξ + (1 – x) t – yu = ξ – xt,

cioè sia u = t / y (y ≠ 0)

Allora ξ certo ≣

ξ+ (1 – x)t + t (1 – y) t / y se p e q veri,

ξ – xt altrimenti.

∴ il grado di convinzione in ‘p e q’ =  Schermata 2013-12-28 alle 09.25.12        = xy. (t≠0)

Se y = 0, comporta t = 0.

Allora ξ certo ≣ ξ se p vero, ξ se p falso

≣ ξ + u se p vero, q vero;  ξ se p falso, q falso; ξ se p falso

≣ ξ+u, pq vero;  ξ, pq falsa

∴ grado di convinzione in pq = 0.

(4) segue da (2), (3) come segue: –

Grado di convinzione in pq = p x  quello in q dato p, dalla (3).

Allo stesso modo il grado di convinzione in p Schermata 2013-08-23 alle 22.32.01    = quello in p x quello in Schermata 2013-08-23 alle 22.32.01     dato p

∴ la  somma = grado di convinzione in p, per la (2).

Queste sono le leggi della probabilità, che abbiamo dimostrato di essere necessariamente vere per ogni insieme coerente di gradi di convinzione. Qualsiasi insieme definito di gradi di convinzione che le infrange sarebbe incoerente nel senso che ha violato le leggi di preferenza tra le opzioni, come quella che la preferenza è una relazione asimmetrica transitiva, e che se α è preferibile a β, β di certo non può essere preferibile ad α se p, β se non-p. Se la condizione mentale di chiunque viola queste leggi, la sua scelta dipenderebbe dalla forma precisa cui le opzioni gli sono state offerte, il che sarebbe assurdo. Potrebbe assumere una scommessa fatta contro di lui con la migliore astuzia e restare a perdere in ogni caso.

Troviamo, quindi, che un calcolo preciso della natura della convinzione parziale rivela che le leggi della probabilità sono leggi di coerenza, un’estensione alle convinzioni parziali della logica formale, la logica della coerenza. Esse non dipendono per il loro significato da qualsiasi grado di convinzione in una proposizione che risulti essere univocamente determinata come una proposizione razionale: ma semplicemente distinguono gli insiemi di convinzioni che vi obbediscono come quelle coerenti. Avere un qualsiasi grado definito di convinzione implica un certo grado di coerenza, vale a dire la volontà di scommettere su una proposizione data con la stessa probabilità per ogni puntata, essendo la puntata misurata in termini di valori massimi.

Avere gradi di convinzione che obbediscono alle leggi della probabilità implica un’ulteriore misura di coerenza, vale a dire una tale coerenza tra le probabilità accettabili su diverse proposizioni da impedire a una scommessa fatta contro di voi.

Alcune considerazioni conclusive su questa sezione non sarebbero fuori luogo. In primo luogo, queste considerazioni si basano fondamentalmente sulle scommesse, ma questo non sembra irragionevole quando si si sia considerato che in tutta la nostra vite stiamo un certo senso scommettendo. Ogni volta che andiamo alla stazione stiamo scommettendo che un treno effettivamente camminerà, e se non avessimo un sufficiente grado di fiducia in questo rifiuteremmo la scommessa e rimarremmo a casa. Le opzioni che Dio ci da’ sono sempre subordinate al nostro indovinare se una certa proposizione è vera. In secondo luogo, si basa tutto sul concetto di speranza matematica; l’insoddisfazione spesso sentita con questa idea è dovuta principalmente alla misura imprecisa del bene. Chiaramente le aspettative matematiche in termini di denaro non sono adatte guide per il comportamento. Va ricordato, nel giudicare il mio sistema, che in esso un valore viene effettivamente definito mediante la speranza matematica in caso di convinzione di grado 1/2, e così possiamo attenderci che possa essere rappresentato adeguatamente in una scala per una utile applicazione della speranza matematica nel caso di altri gradi di convinzione.

In terzo luogo, nulla è stato detto sui gradi di convinzione quando il numero di alternative è infinito. A proposito di questo non ho niente di utile da dire, tranne che dubito che la mente sia capace di contemplare più di un numero finito di alternative. Si possono prendere in considerazione domande alle quali sia possibile un numero infinito di risposte, ma al fine di esaminare le risposte si devono riunire in un numero finito di gruppi. La difficoltà diventa praticamente rilevante quando si parla di induzione, ma anche allora mi sembra non ci sia necessità di introdurla. Possiamo discutere se l’esperienza passata fornisce un elevata probabilità al levarsi del sole domani senza preoccuparsi di quale probabilità ciò dia al sole di alzarsi ogni mattina per sempre. Per questo motivo non posso ma non intendo che la discussione del problema 1 di Ritchie sia insoddisfacente; è vero che possiamo convenire che le generalizzazioni per induzione  non richiedono nessuna probabilità finita, ma aspettative particolari intrattenute su basi induttive senza dubbio hanno una elevata probabilità numerica nelle menti di tutti noi. Siamo tutti più certi che il sole sorgerà  domani che non avrò 12 con due dadi al primo tiro, ovvero abbiamo una convinzione di grado più elevato di 35/36 in quel caso. Se mai l’induzione richiedesse una giustificazione logica  questa è in rapporto con la probabilità di un evento come questo.

1 A.D. Ritchie, “Induction and Probability”. Mind, 1926. p. 318. ‘La conclusione della discussione precedente può essere messa in modo semplice. Se il problema dell’induzione fosse posto come “Come le generalizzazioni induttive possono acquisire una grande probabilità numerica? ” allora questo è uno pseudo-problema, perché la risposta è “non possono”. Questa risposta, tuttavia,  non è una negazione della validità dell’induzione, ma è una diretta conseguenza della natura della probabilità. Lascia ancora intatto il vero problema dell’induzione che è “Come può essere aumentata la probabilità di una induzione? ” e lascia in piedi l’intera discussione di Keynes su questo punto.’

(4) LA LOGICA DELLA COERENZA

Possiamo essere d’accordo che in un certo senso sia compito della logica di dirci che cosa dobbiamo pensare; ma l’interpretazione di questa affermazione solleva notevoli difficoltà. Si può dire che dobbiamo pensare ciò che è vero, ma in questo senso ci viene detto cosa pensare da tutta la scienza e non semplicemente dalla logica. Né, in questo senso, può essere basata alcuna giustificazione per la convinzione parziale; la cosa migliore idealmente è che avremmo convinzioni di grado 1 in tutte le proposizioni vere e convinzioni di grado 0 in tutte le proposizioni false. Ma questo è un criterio troppo elevato da attendersi da uomini mortali, e dobbiamo convenire che alcuni gradi di dubbio o di errore possono essere umanamente giustificati.

Molti logici, suppongo, accetterebbero come valutazione della loro scienza le parole di apertura di Keynes nel ‘Treatise on Probability’: “parte della nostra conoscenza si ottiene direttamente, e in parte dalla ragione. La teoria della probabilità si occupa della parte che si ottiene con il ragionamento, e tratta dei diversi gradi in cui i risultati così ottenuti sono inoppugnabili o non inoppugnabili. ” Dove Keynes dice: ‘La teoria della probabilità’, altri direbbero la Logica. Si ritiene, vale a dire, che le nostre opinioni possono essere divise in quelle che possediamo immediatamente come risultato della percezione o della memoria, e quelle che ci derivano dal passato per ragionamento. E’ compito della Logica di accettare quanto viene dalla classe del passato e criticare solo la derivazione di una seconda classe da questa.

La logica come scienza del ragionamento e di inferenza è tradizionalmente e giustamente suddivisa in deduttiva e induttiva; ma la differenza e la relazione tra queste due divisioni del soggetto possono essere concepite in modi estremamente diversi. Secondo Keynes i ragionamenti deduttivi e induttivi validi sono fondamentalmente simili; entrambi sono giustificati da relazioni logiche tra premessa e conclusione che differiscono solo nel grado. Non posso accettare questa posizione, come ho già spiegato. Io non vedo cosa queste relazioni logiche inconclusive possano essere o come possano giustificare convinzioni parziali. Nel caso di ragionamenti logici inoppugnabili posso accettare la ragione della loro validità che è stata data da molte autorità, e la stessa si può trovare sostanzialmente in Kant, De Morgan, Peirce e Wittgenstein. Tutti questi autori concordano sul fatto che la conclusione di un argomento formalmente valido è contenuta nelle sue premesse; che negare la conclusione pur accettando le premesse sarebbe auto-contraddittorio; che la deduzione formale non aumenta la nostra conoscenza, ma mette in evidenza chiaramente ciò che già conosciamo in un’altra forma; e che siamo obbligati ad accettare la sua validità a meno di accettare l’incoerenza con noi stessi. La relazione logica che giustifica l’inferenza è che il senso o il valore della conclusione è contenuto in quello delle premesse.

Ma nel caso di un ragionamento induttivo questo non avviene affatto; è impossibile rappresentarlo come se somigliasse ad un ragionamento deduttivo semplicemente di grado più debole; è assurdo dire che il senso della conclusione è parzialmente contenuto in quello delle premesse. Potremmo accettare le premesse e assolutamente respingere la conclusione, senza alcun tipo di incoerenza o contraddizione. Mi sembra, quindi, che possiamo dividere i ragionamenti in due tipi radicalmente differenti, che noi possiamo riconoscere nelle parole di Peirce come (1) ‘esplicativi, analitici, o deduttivi’ e (2) ‘amplificativi, sintetici, oppure (in senso lato) Induttivi’.1 I ragionamenti del secondo tipo sono da un importante punto di vista molto più vicini ai ricordi e alle percezioni rispetto ai ragionamenti deduttivi. Possiamo considerare la percezione, la memoria e l’induzione come tre fondamentali mezzi per acquisire la conoscenza; la deduzione invece è soltanto un metodo di organizzare la nostra conoscenza e di eliminare incongruenze o contraddizioni.

La logica deve quindi rientrare decisamente in due parti: (escludendo la logica analitica, la teoria dei termini e delle proposizioni) abbiamo la logica minore, che è la logica della coerenza, o logica formale, e la logica maggiore, che è la logica della scoperta, o la logica induttiva.

Quello che abbiamo ora da osservare è che questa distinzione in alcun modo coincide con la distinzione tra certezza e convinzioni parziali; abbiamo visto che esiste una teoria della coerenza nella convinzione parziale non meno della coerenza nella convinzione certe, sebbene per vari motivi la prima non è così importante come la seconda. La teoria della probabilità è in realtà una generalizzazione della logica formale; ma nel processo di generalizzazione uno degli aspetti più importanti della logica formale è demolito.  Se p e  Schermata 2013-08-23 alle 22.32.01       non sono coerenti in modo che q segue logicamente da p, che p implica q è ciò che è chiamato da Wittgenstein una ‘tautologia’ e può essere considerato come un caso degenere di una proposizione vera che non comporti il concetto di coerenza. Questo ci permette di considerare (non del tutto correttamente) la logica formale inclusa la matematica come una scienza oggettiva costituita da proposizioni necessariamente oggettive. Questo ci fornisce non soltanto la ἀνάγκη λέγειν, che se noi affermiamo p siamo costretti dalla coerenza affermare anche q, ma anche l’ ἀνάγκη εἶναι, che se p è vero, così deve essere q. Ma quando estendiamo la logica formale per includere le convinzioni parziali tale interpretazione oggettiva esplicita è perduta;  se crediamo pq nella misura di 1/3 e p  Schermata 2013-08-23 alle 22.32.01   nella misura di 1/3 siamo costretti per coerenza a credere anche  Schermata 2013-11-24 alle 21.04.13     nella misura di 1/3.  Questo è ἀνάγκη λέγειν, ma non possiamo dire che se pq è vero per 1/3 e p Schermata 2013-08-23 alle 22.32.01     vero per 1/3, anche Schermata 2013-11-24 alle 21.04.13  deve essere vero per 1/3, perché questa asserzione sarebbe puro non senso. Lì non ci sarebbe corrispondenza ἀνάγκη εἶναι. Quindi, a differenza del calcolo di coerenza della convinzione piena, il calcolo dell’oggettiva parziale convinzione non può essere immediatamente interpretato come un corpo di oggettiva tautologia.

Questo è però possibile in modo indiretto; abbiamo visto all’inizio di questo saggio che il calcolo delle probabilità potrebbe essere interpretato in termini di rapporti di classi; ora abbiamo scoperto che può anche essere interpretato come un calcolo di coerente convinzione parziale. E’ naturale, quindi, che dovremmo aspettarci una qualche intima connessione tra queste due interpretazioni, una spiegazione della possibilità di applicare lo stesso calcolo matematico a due insiemi diversi di tali fenomeni. Nè c’è una spiegazione difficile da trovare, ci sono molte connessioni tra convinzioni parziali e frequenze. Per esempio, le frequenze sperimentate spesso portano a corrispondenti convinzioni parziali, e convinzioni parziali portano all’aspettativa di frequenze corrispondenti in accordo al teorema di Bernoulli. Ma nessuna di queste è esattamente la correlazione che vorremmo; una convinzione parziale non può in generale essere collegata univocamente con qualsiasi frequenza effettiva, perché la correlazione viene sempre realizzata prendendo la proposizione in questione come un caso di una funzione proposizionale. Quale funzione proposizionale abbiamo scelto è in qualche misura arbitraria e la frequenza corrispondente varierà notevolmente con la nostra scelta. Le pretese di alcuni esponenti della teoria della frequenza che la convinzione parziale significa piena convinzione in una proposizione sulla frequenza non può essere sostenuta.

1 C.S. Peirce Chance Love and Logic, p.92

Ma abbiamo scoperto che l’idea stessa della convinzione parziale comporta il riferimento ad una ipotetica o ideale frequenza; supponendo che il bene abbia la proprietà additiva, credere con il grado m/n è un tipo di convinzione che conduce alla azione che vorremmo fosse la migliore se ripetuta n volte in m delle quali la proposizione sia vera; o potremmo dire più brevemente che questo è il tipo di convinzione più appropriata ad un certo numero di occasioni ipotetiche altrimenti identiche nella proporzione m/n per cui la proposizione in questione è vera. E’ questa correlazione tra convinzione parziale e frequenza che ci permette di utilizzare il calcolo delle frequenze, come un calcolo di coerente convinzione parziale. E in un certo senso possiamo dire che le due interpretazioni sono gli aspetti oggettivi e soggettivi dello stesso significato recondito, così come la logica formale può essere interpretata oggettivamente come un corpo di tautologie e soggettivamente come le leggi del pensiero coerente.

Noi, credo, scopriremo che questo punto di vista del calcolo delle probabilità rimuove varie difficoltà che finora sono stati trovate sconcertanti. In primo luogo ci fornisce una evidente giustificazione degli assiomi di calcolo, che in un sistema come quello di Keynes è totalmente mancante. Perché ora si vede facilmente che se le convinzioni parziali sono coerenti obbediranno a questi assiomi, ma è assolutamente oscuro perché le misteriose relazioni logiche di Keynes dovrebbero obbedire a questi assiomi. 1 Dovremmo essere così stranamente ignoranti degli esempi di queste relazioni, e così stranamente perspicaci circa le loro leggi generali.

In secondo luogo, possiamo fare a meno del Principio di Indifferenza; noi non lo consideriamo appartenente alla logica formale nel dire che sarebbe una previsione di una persona l’estrarre una palla bianca o nera da un’urna; le sue aspettative iniziali potrebbero essere entro i limiti della coerenza qualcosa che egli preferisce; tutto quello che dobbiamo sottolineare è che se ha certe aspettative egli è tenuto per coerenza ad averne certe altre. Questo è semplicemente prendere la probabilità sullo stesso piano della normale logica formale, che non critica le premesse, ma dichiara semplicemente che alcune conclusioni sono le sole coerenti con esse. Essere in grado portare fuori dalla logica formale il Principio di Indifferenza è un grande vantaggio; perché è abbastanza evidentemente impossibile stabilire condizioni puramente logiche per la sua validità, come viene tentato da Keynes. Non voglio discutere la questione in dettaglio, perché porta alla pedanteria e a distinzioni arbitrarie che potrebbero essere discusse per sempre. Ma chi cerca di decidere con i metodi di Keynes quali siano le alternative adeguate a considerare l’equiprobabile nella meccanica delle molecole, ad esempio in Gibbs nello spazio-fase, sarà presto convinto che sia una questione di fisica piuttosto che di logica pura. Usando la formula di moltiplicazione, come viene usato nella probabilità inversa, possiamo in base alla teoria di Keynes ridurre tutte le probabilità a quozienti di probabilità a priori; ed è quindi con riguardo a questi ultimi che il principio di indifferenza è di primaria importanza, ma qui il problema non è ovviamente un problema di logica formale. Come possiamo semplicemente su basi logiche suddividere lo spettro in bande equiprobabili?

Nel sistema di Keynes appare come se gli assiomi principali – le leggi di addizione e moltiplicazione – non siano altro che definizioni. Si tratta semplicemente di un errore logico; le sue definizioni sono formalmente errate, a meno che vengano assunti i corrispondenti assiomi. Così la sua definizione di moltiplicazione presuppone la legge che se la probabilità di a dato bh è uguale a quella di c dato dh, e la probabilità di b dato h è uguale a quella di d dato k, allora la probabilità di ab dato h e di cd dato k saranno uguali.

Una terza difficoltà che viene eliminata dalla nostra teoria è quella che è presente nella teoria di Keynes nel caso seguente. Credo di percepire o ricordare qualcosa ma non sono sicuro; questo sembrerebbe darmi qualche motivo di credere, contrariamente alla teoria di Keynes,per cui il grado di convinzione che dovrei avere essendo razionale per me  è quello dato dal rapporto di probabilità tra la proposizione in questione e le cose che so per certe. Egli non può giustificare una probabile convinzione fondata non su ragionamenti ma su diretta sperimentazione. A nostro avviso non ci sarebbe niente di contrario alla logica formale, in una tale convinzione; se questo sia ragionevole dipenderà da quello che ho chiamato la grande logica che sarà il soggetto del prossimo capitolo; vedremo che non c’è nessuna obiezione a tale possibilità, con la quale il metodo di Keynes di giustificare la probabile convinzione esclusivamente attraverso relazione di conoscenza certa non è assolutamente in grado di sostenere.

(5) LA LOGICA DELLA VERITÁ

La validità della distinzione tra la logica di coerenza e la logica della verità è stata spesso contestata; è stato sostenuto da un lato che la coerenza logica è solo una specie di coerenza basata sui fatti; che se la convinzione in p non è coerente con una in q, significa semplicemente che p e q non sono entrambe vere, e che questo è un fatto necessario o fatto logico. Personalmente, ritengo che questa difficoltà può essere soddisfatta dalla teoria di Wittgenstein sulla tautologia, secondo la quale se una convinzione in p è incompatibile con quella di q che p e q non sono entrambe vere non è un fatto, ma una tautologia. Ma io non mi propongo di discutere di questo problema ulteriormente qui.

Dall’altra parte si sostiene che la logica formale o la logica di coerenza sia  l’insieme della logica e la logica induttiva  sia o un nonsenso o una parte delle scienze naturali. Questa asserzione, che suppongo che sia stata fatta da da Wittgenstein, sento più difficile da controbattere. Ma io credo che sarebbe un peccato, a causa del rispetto verso l’autorità, rinunciare a provare a dire qualcosa di utile sull’induzione.

Dobbiamo quindi tornare indietro alla concezione generale della logica come scienza del pensiero razionale. Noi troviamo che le parti più generalmente accettate della logica, vale a dire, la logica formale, la matematica e il calcolo delle probabilità, riguardano tutte semplicemente il garantire che le nostre convinzioni non siano auto-contraddittorie. Abbiamo posto davanti a noi stessi i criteri di coerenza e costruito queste elaborate regole per garantirne l’osservanza. Ma ovviamente questo non basta; vogliamo che le nostre convinzioni siano coerenti non solo l’una con l’altra ma anche con i fatti 1: né è ancora chiaro che la coerenza sia sempre vantaggiosa; ma potrebbe essere meglio essere a volte nel giusto che mai nel giusto. Né quando vogliamo essere coerenti siamo sempre in grado di esserlo: ci sono proposizioni matematiche la cui verità o falsità non può ancora essere decisa. Eppure si può umanamente parlando di avere diritto di prendere in considerazione un certo grado di convinzione in quelle per motivi induttivi o su altre basi: una logica che si propone di giustificare un tale grado di convinzione deve essere disposta in realtà  ad andare contro la logica formale; perché a una verità formale logica si può assegnare solo una convinzione di grado 1. Si potrebbe dimostrare nel sistema di Keynes che la sua probabilità è pari a 1 in qualsiasi prova. Questo punto mi sembra di dimostrare in modo particolarmente evidente che la logica umana o la logica della verità, che dice agli uomini come dovrebbero pensare, non è solo indipendente, ma a volte in realtà incompatibile con la logica formale.

1 Cfr.. Kant: ‘Denn obgleich eine Erkenntnis der logischen Form völlig gemäss sein möchte, dass ist sich selbst nicht widerspräche, so kann sie doch noch immer dem Gegenstande widersprechen.’ Kritik der reinen Vernunft, ‘, Prima Edizione p. 59. Infatti, sebbene la conoscenza della forma logica sia del tutto coerente cioè non contraria a sé, può tuttavia essere in disaccordo con l’oggetto ‘. Critica della ragion pura.

Nonostante questo quasi tutto il pensiero filosofico sulla logica umana e in particolare sull’induzione ha cercato di ridurlo in qualche modo alla logica formale. Non si suppone questo, se non da pochissimi, che la coerenza da sé stessa conduca alla verità; ma che alla coerenza con l’osservazione e la memoria spesso è attribuito questo potere.

Dal momento che un’osservazione ha cambiato (almeno in grado) la mia opinione sul fatto osservato, alcuni dei miei gradi di convinzione dopo l’osservazione sono necessariamente non coerenti con quelli che avevo prima. Dobbiamo quindi spiegare come esattamente l’osservazione potrebbe modificare i miei gradi di convinzione; ovviamente se p è il fatto osservato, il mio grado di convinzione in q dopo l’osservazione dovrebbe essere uguale al mio grado di convinzione in q dato p di prima, o dalla legge di moltiplicazione, al quoziente del mio grado di convinzione in pq per il mio grado di convinzione in p . Quando i miei gradi di convinzione cambiano in questo modo possiamo dire che essi sono stati modificati coerentemente con la mia osservazione.

Usando questa definizione, o nel sistema di Keynes semplicemente utilizzando la legge di moltiplicazione, possiamo prendere i miei attuali gradi di convinzione, e considerando la totalità delle mie osservazioni, scoprire da quali gradi iniziali di convinzione i miei attuali gradi di convinzione sarebbero sorti da questo processo di coerente modifica. I miei livelli attuali di convinzione possono quindi essere considerati logicamente giustificati se i corrispondenti gradi iniziali di convinzione sono logicamente giustificati. Ma il chiedere quali gradi iniziali di convinzione siamo giustificati, o nel sistema di Keynes quali sono le probabilità assolute a priori, mi sembra un problema senza senso; e anche se avesse un significato non vedo come potrebbe essere risolto.

Se abbiamo effettivamente applicato questo processo per un essere umano, scoperto, vale a dire, su quali probabilità a priori le sue opinioni attuali dovrebbero essere basate, dovremmo ovviamente trovarle tra quelle determinate da selezione naturale, con una generale tendenza a dare una maggiore probabilità alle alternative più semplici. Ma, come ho detto , non riesco a vedere quale potrebbe essere lo scopo di chiedersi se questi gradi di convinzione siano logicamente giustificati.

Ovviamente la cosa migliore sarebbe quella di sapere con certezza in anticipo che cosa sia vero e cosa falso, e quindi se un qualsiasi sistema di convinzioni iniziali dovesse ricevere l’approvazione del filosofo dovrebbe essere questo. Ma evidentemente questo non sarebbe accettato dai pensatori della scuola che sto criticando. Un’altra alternativa è quella di ripartire le probabilità iniziali sul sistema puramente formale esposto da Wittgenstein, ma come questo non fornisce alcuna giustificazione per l’induzione non può darci la logica umana che stiamo cercando.

Dobbiamo quindi cercare di avere un’idea di una logica umana che non deve tentare di essere riducibile alla logica formale. La logica, possiamo essere d’accordo, non riguarda ciò che gli uomini credono davvero, ma quello che dovrebbero credere, o quello che sarebbe ragionevole credere. Cosa significa allora, dobbiamo chiederci, dire che è ragionevole per un uomo avere questo o quel grado di convinzione in una proposizione? Prendiamo in considerazione le possibili alternative.

In primo luogo, questo significa a volte qualcosa di spiegabile in termini di logica formale: possiamo abbandonare questa possibilità per i motivi già spiegati. In secondo luogo, a volte significa semplicemente che essendo io al suo posto (e non ad esempio ubriaco) avrei avuto un tale grado di convinzione. In terzo luogo, a volte significa che se la sua mente lavora secondo certe regole, che possiamo approssimativamente chiamare ‘metodo scientifico’, avrebbe avuto un tale grado di convinzione. Ma in quarto luogo non è necessario sostenere nessuna di queste cose; perché gli uomini non hanno sempre creduto nel metodo scientifico, e proprio come noi domandiamo’ Ma io sono necessariamente ragionevole‘, possiamo anche chiedere ‘Ma è lo scienziato necessariamente ragionevole?’ In quest’ultimo significato mi sembra che possiamo identificare una ragionevole opinione con l’opinione di una persona ideale in circostanze analoghe. Quale, invece, sarebbe l’opinione di questa persona ideale ? Come è stato già osservato, il più alto ideale sarebbe sempre che avrebbe una opinione vera e sarebbe certo di ciò; ma questo ideale è più adatto a Dio che all’uomo.1

Dobbiamo dunque considerare la mente umana e ciò che è il massimo che possiamo chiedere ad essa. 2 La mente umana lavora essenzialmente in base a regole generali o abitudini; un processo mentale che non procede secondo qualche regola sarebbe semplicemente una sequenza casuale di idee; ogni volta che si deduce A da B lo facciamo in virtù di una qualche relazione tra di loro. Possiamo quindi affermare il problema dell’ideale come ” Quali abitudini in senso generale sarebbero le migliori che avesse la mente umana? ” Questo è un grande e indeterminato problema che difficilmente potrebbe essere risolto a meno che le possibilità fossero dapprima state limitate da una concezione abbastanza precisa della natura umana. Potremmo immaginare alcune abitudini molto utili diverse da quelle possedute da tutti gli uomini. [ Va precisato che io uso l’abitudine con il significato più ampio possibile per significare semplicemente regola o legge di comportamento, tra cui l’istinto: non voglio distinguere regole o abitudini acquisiti in senso stretto dalle regole innate o istinti, ma mi propongo di chiamarle tutte ugualmente abitudini.] Una analisi del tutto generale della mente umana è quindi destinata ad essere vaga e futile, ma qualcosa di utile si può dire se limitiamo l’argomento nel modo seguente.

Supponiamo di avere l’abitudine di formare un’opinione in un certo modo; ad esempio l’abitudine di derivare dall’opinione che un fungo è giallo l’opinione che sia velenoso. Allora possiamo accettare il fatto che la persona ha un’abitudine di questo genere, e chiedere semplicemente quale grado di parere che il fungo è velenoso sarebbe meglio per lui prendere in considerazione quando lo vede; cioè ammettendo che pensa sempre nello stesso modo su tutti i funghi gialli, possiamo chiedere quale sia il grado di fiducia migliore che lui dovrebbe avere che quei funghi siano velenosi. E la risposta è che sarà in generale migliore per il suo grado di convinzione che un fungo giallo è velenoso sia pari alla quota di funghi gialli che sono in realtà velenosi. (Ciò deriva dal significato del grado di convinzione.) Questa conclusione è necessariamente vaga per quanto riguarda l’area spazio-temporale dei funghi, che include, ma difficilmente più vaga della domanda a cui risponde. (Cfr. densità in un punto di gas composto da molecole.)

1[ Una precedente stesura della materia del paragrafo in qualche modo migliore. – F.P.R. Che cosa si intende dicendo che un certo grado di convinzione è ragionevole ? Primo e spesso che è quello che prenderei in considerazione se avessi i pareri della persona in questione al momento, ma erano diversi da come sono adesso, ad esempio, non ubriachi. Ma a volte andiamo oltre e chiediamo: ‘ Sono ragionevole?’ Questo può significare, mi comporto conformemente a determinate norme, enumerabili che noi chiamiamo metodo scientifico, e che stimiamo a causa del valore di chi lo pratica ed il successo che raggiunge. In questo senso essere ragionevoli significa pensare come uno scienziato, o essere guidato solo da raziocinio e induzione o qualcosa del genere (vale a dire mezzi ragionevoli di riflessione). In terzo luogo, possiamo andare alla radice del perché ammiriamo lo scienziato e analizziamo non un parere particolare primario, ma un abitudine mentale che conduce o meno alla scoperta della verità o prende in considerazione quei gradi di convinzione che sarebbero più utili. (Per includere le abitudini al dubbio o alla convinzione parziale). Allora possiamo considerare un parere secondo l’ abitudine che lo ha prodotto. Questo è chiaramente ragionevole, perché tutto dipende da questa abitudine; ma non sarebbe ragionevole ottenere la giusta conclusione di un sillogismo ricordando in modo impreciso che si lascia fuori un termine che è comune ad entrambe le premesse. Usiamo ragionevole nel senso 1 quando parliamo di un argomento di uno scienziato questo non mi sembra ragionevole; nel senso 2 quando confrontiamo la ragione e superstizione o istinto; nel senso 3 quando si valuta il valore dei nuovi metodi di pensiero come la divinazione.]

2 Quello che segue fino alla fine della sezione è quasi interamente basato sugli scritti di C.S. Peirce . [Soprattutto le sue ” illustrazioni della Logica della scienza “, Popular Science Monthly 1877 e 1878 , ristampato in Chance Love and Logic ( 1923).]

Mettiamola in un altro modo: ogni volta che faccio una deduzione, la faccio in base a qualche regola o abitudine. Un’inferenza non è completamente data quando ci è data la premessa e la conclusione; deve essere data anche la relazione fra esse in virtù della quale viene realizzata la deduzione. La mente funziona per leggi generali; quindi se deduce q da p , questo sarà generalmente perché q è un caso di una funzione φx e p il corrispondente caso di una funzione ψx tale che la mente sempre dedurrà φx da ψx . Quando quindi non analizziamo le opinioni, ma i processi attraverso cui sono nate, la regola della deduzione determina per noi un intervallo a cui la teoria della frequenza può essere applicata. La regola di deduzione può essere ristretta, come quando vedendo un fulmine mi aspetto il tuono, o larga , come quando si considerano 99 casi di una generalizzazione che ho osservato per essere vera concludo che il centesimo anche è vero. Nel primo caso, l’abitudine che determina il processo è ‘ Dopo il lampo si aspetta il tuono ‘; il grado di affidamento che sarebbe il migliore per questa abitudine da esprimere è pari al rapporto tra i casi di lampi che siano effettivamente seguiti da tuoni. Nel secondo caso l’abitudine è quella più generale di inferire da 99 casi osservati un certo tipo di generalizzazione che il centesimo è anche vero; il grado di convinzione che sarebbe meglio per questa abitudine da esprimere è uguale alla proporzione di tutti i casi dei 99 esempi di una generalizzazione che è vera, in cui anche il centesimo è vero.

Così dato un unico parere , possiamo solo lodarlo o biasimarlo sulla base della verità o della falsità: data l’abitudine ad una certa forma, possiamo lodarlo o biasimarlo di conseguenza a seconda che il grado di convinzione che produce sia vicino o lontano dalla reale proporzione in cui l’abitudine conduce alla verità. Possiamo allora lodare o biasimare opinioni in forma derivata dalla nostra lode o biasimo delle abitudini che li producono.

Questa relazione può essere applicata non solo alle abitudini di deduzione, ma anche alle abitudini di osservazione e alla memoria; quando abbiamo una certa sensazione in relazione con un’immagine pensiamo che l’ immagine rappresenti qualcosa che in realtà è successo a noi, ma non possiamo esserne sicuri; il grado di diretta fiducia nella nostra memoria varia. Se ci chiediamo qual è il miglior grado di fiducia che possiamo riporre in una sicura specifica sensazione di memoria, la risposta deve dipendere da quanto spesso, quando questo sentimento si verifica l’evento a cui l’immagine si collega si è veramente verificato.

Tra le abitudini della mente umana una posizione di particolare importanza è occupata dall’induzione. Fin dai tempi di Hume molto è stato scritto circa la giustificazione dell’inferenza induttiva. Hume ha mostrato che non poteva essere ridotta a inferenza deduttiva o giustificata dalla logica formale. Nel modo in cui si sviluppa la sua dimostrazione mi sembra definitiva; e il suggerimento di Keynes che può essere aggirata per quanto riguarda l’induzione come una forma di inferenza probabile, non può a mio avviso essere accettato. Ma supporre che la situazione che ne deriva sia uno scandalo per la filosofia è, a mio avviso, un errore.

Siamo tutti convinti per ragionamenti induttivi, e la nostra convinzione è ragionevole, perché il mondo è così costituito che gli argomenti induttivi conducono tutto sommato a pareri veri. Non siamo, pertanto, in grado di avere fiducia nell’induzione, né se potessimo aiutarla non vedremmo alcuna ragione per cui dovremmo, perché noi crediamo che sia un processo affidabile. E vero che che se qualcuno non ha l’abitudine nell’induzione, non potremmo dimostrargli che sbaglia; ma non c’è nulla di particolare in questo. Se un uomo dubita della propria memoria o della sua percezione non possiamo dimostrargli che sono affidabili; il chiedere per questo una cosa che lo provi è piangere per la luna, e lo stesso vale per l’induzione. E’ una delle principali fonti di conoscenza così come lo è la memoria: nessuno considera uno scandalo per la filosofia che non c’è la prova che il mondo non sia cominciato due minuti fa e che tutti i nostri ricordi non siano illusori.

Siamo tutti d’accordo che un uomo che non ha fatto induzioni sarebbe non razionale: il problema è solo ciò che questo significa. A mio parere ciò non significa che l’uomo peccherebbe contro la logica formale o la probabilità formale; ma che non avrebbe acquisito un’abitudine molto utile, senza la quale starebbe molto peggio, nel senso di essere molto meno probabile 1 che abbia opinioni vere.

Si tratta di una sorta di pragmatismo: noi giudichiamo le abitudini mentali a seconda se funzionano, cioè se le opinioni che inducono siano per la maggior parte vere, o più spesso vere di quelle che differenti abitudini indurrebbero.

L’induzione è una abitudine utile, e ad adottarla è ragionevole. Tutto ciò che la filosofia può fare è di analizzarla, determinare il grado della sua utilità, e trovare da quali caratteristiche della natura, questa dipenda. Un mezzo indispensabile per indagare questi problemi è l’induzione stessa, senza la quale saremmo impotenti. In questa circolarità non si si trova nessun circolo vizioso. E’ solo attraverso la memoria che possiamo determinare il grado di accuratezza della memoria; perché se facciamo esperimenti per determinare questo effetto, essi saranno inutili se non li ricordassimo.

Si consideri, alla luce della discussione precedente quale tipo di soggetto sia induttivo o di logica umana – la logica della verità. La sua attività è quella di prendere in considerazione i metodi di pensare, e scoprire che misura di fiducia si debba riporre in questi, vale a dire in quale proporzione di esperienze essi conducono alla verità. In questa analisi essa può solo essere distinta dalle scienze naturali per la maggiore generalità dei suoi problemi. Si deve considerare la relativa validità dei diversi tipi di procedure scientifiche, come ad esempio la ricerca di una legge causale con i Metodi Mill, ed i moderni metodi matematici come il ragionamento a priori usato nella scoperta della Teoria della Relatività. Il progetto corretto di tale soggetto si può trovare in Mill 1, io non intendo i dettagli dei suoi Metodi o anche l’uso della Legge di Causalità. Ma il suo modo di trattare l’argomento come un corpo di induzioni riguardante induzioni, la Legge di Causalità che governa meno le leggi essendo essa stessa dimostrata per induzione per semplice enumerazione. I diversi metodi scientifici che possono essere utilizzati sono in ultima istanza valutati per induzione per semplice enumerazione; abbiamo scelto la più semplice legge che si adatta ai fatti, ma se non scopriamo che leggi così ottenute si adattano anche a fatti differenti da quelli per cui erano state realizzate per adattarsi, dobbiamo scartare questa procedura per qualche altra.

1 ‘probabile’ qui significa semplicemente che io non sono sicuro di questo, ma ho solo un certo grado di convinzione in esso.

 Cfr.. anche la relazione sulle ‘General rules’ nel capitolo ‘Of Unphilosophical Probability’ nel Trattato di Hume.

Universals – Note on the preceding paper da The Foundation of Mathematics di Frank Ramsey

3 Giu

Schermata 2013-11-30 alle 15.07.43Propongo la mia traduzione della quarta e quinta parte delle opere pubblicate di Frank Plumpton Ramsey  raccolte da R. B. Braithwaite sotto il titolo The Foundation of Mathematics.

Questa sezione, anche se apparentemente sembra una esercitazione di logica astratta presenta la soluzione di problemi logici e filosofici molto complessi. Si osserva in particolare l’influenza di Ludwig Wittgenstein nell’elaborazione di questi concetti che potrebbero essere da molti scambiati per “roba da matematici puri” mentre influiscono molto profondamente nel modo di concepire e interpretare a realtà.

IV

Universali (1925 )

Lo scopo di questo lavoro è quello di valutare se esista una divisione fondamentale di oggetti in due classi, particolari e universali. La questione è stata discussa da Russell in un articolo riportato negli Atti dell’Aristotelian Society del 1911. La sua conclusione che la distinzione era definitiva è stata basata su due comuni argomenti, diretti contro i due ovvii metodi di abolire la distinzione ritenendo o che gli universali sono insiemi di particolari, o che i particolari sono insiemi delle loro qualità. Questi ragionamenti, appaiono perfetti corretti fino a che sono accettabili, comunque non mi sembra che risolvano l’intera questione. Il primo, che appare di nuovo in The Problems of Philosophy, mostra come in opposizione ai nominalisti che una certa proposizione come ‘ Questo dato sensoriale è bianco ‘ deve avere come unico costituente, qualcosa come la bianchezza o la somiglianza, che non è della stesso tipo logico del dato sensoriale stesso. Il secondo argomento , anche brevemente esposto in The Nature of Existence di McTaggart, dimostra che un uomo non può essere identificato con la somma delle sue qualità.

Ma sebbene un uomo non possa essere una delle sue qualità, non c’è ragione per cui non dovrebbe essere una qualità di qualcos’altro.

In realtà gli oggetti materiali sono descritti da Whitehead come ‘ veri aggettivi Aristotelici ‘; così che non possiamo considerare che questi due argomenti interpretino la distinzione tra particolare e universale al sicuro contro ogni critica .

Che cosa è allora, mi propongo di chiedere, la differenza tra particolare e universale? Che cosa possiamo dire di una cosa che non sarà vera anche per un’altra? Se seguiamo Russell dovremo indagare su tre tipi di distinzione, psicologiche, fisiche e logiche. In primo luogo abbiamo la differenza tra una percezione e un concetto, gli oggetti di due diversi tipi di atti mentali; ma è improbabile che questa sia una distinzione di qualche fondamentale importanza, dal momento che una differenza tra due atti mentali non può corrispondere a qualche differenza in quale che sia dei loro oggetti. Poi abbiamo diverse distinzioni tra gli oggetti in base alle loro relazioni con lo spazio e il tempo; per esempio, alcuni oggetti possono essere solo in un luogo in un certo tempo; altri, come il colore rosso, possono esserlo in molti. Anche in questo caso, nonostante l’ importanza del tema , non credo che possiamo aver raggiunto il nocciolo della questione. Perché quando, per esempio , Whitehead dice che un tavolo è un aggettivo, e Johnson che si tratta di un sostantivo, non stanno discutendo in quanti posti il tavolo può essere in una sola volta, ma sulla sua natura logica. E così è con le distinzioni logiche di cui principalmente la nostra indagine deve occuparsi.

Secondo Russell la classe degli universali è la somma della classe dei predicati e della classe delle relazioni; ma questa dottrina è stato negata da Stout .1 Ma a Stout è stato già sufficientemente risposto. 2 Quindi io discuterò solo la comune opinione a cui Russell aderisce.

1 “The Nature of Universals and Propositions”, Proc. . British Academy , 1921-1922 ( ristampato in Studies in Philosophy and Psychology, 1930) .

2 Cfr. il simposio tra GE Moore , G.F. Stout & G. Dawes Hicks Aristotelian Society Supplementary Volume III, 1923.

Secondo lui i termini sono suddivisi in singolari o particolari, qualità e relazioni, qualità e relazioni che sono riuniti insieme come universali; e talvolta le qualità sono anche incluse tra le relazioni come relazioni ad un termine per distinguerle dalle relazioni a due, tre o più termini.

Johnson divide anche i termini in sostantivi e aggettivi, comprendendo le relazioni come aggettivi transitivi; ed egli considera la distinzione fra sostantivo e aggettivo per spiegare quelle tra particolare e universale. Ma tra queste autorità, che sono così lontanamente d’accordo, c’è ancora una differenza importante. Johnson sostiene che sebbene la natura di un sostantivo sia tale che può in una proposizione solo avere funzione di soggetto e mai di predicato, tuttavia un aggettivo può avere funzione sia come predicato sia come soggetto di cui un aggettivo secondario può essere predicato. Ad esempio , in ‘ la mancanza di puntualità è un difetto ‘ il soggetto è esso stesso un aggettivo – la qualità della mancanza di puntualità . Vi è quindi una mancanza di simmetria tra sostantivi e aggettivi, perché mentre un predicato deve essere un aggettivo, un soggetto può essere sia un sostantivo sia un aggettivo, e dobbiamo definire un sostantivo come un termine che può essere solo un soggetto, mai una predicato .

Russell, invece, nelle sue lezioni sull’Atomismo Logico 1 ha negato questo. Egli dice che in un aggettivo c’è qualcosa di incompleto, qualche suggerimento della forma di una proposizione; così che il simbolo dell’aggettivo non  può mai stare da solo o essere il soggetto di una proposizione, ma deve essere completato in una proposizione in cui è predicato. Così, egli dice, il simbolo appropriato per l’essere rosso non è la parola ‘rosso’, ma la funzione ‘ x è rosso ‘, e il rosso può entrare in una proposizione solo attraverso i valori di questa funzione. Quindi Russell direbbe ‘ la mancanza di puntualità è un difetto ‘ in realtà intenderebbe qualcosa come ‘ Per tutte le x, se x è non è puntuale, x è riprovevole ‘; e l’aggettivo mancanza di puntualità non è il soggetto della proposizione ma solo entra in esso come il predicato di quelle delle sue parti che sono nella forma ‘ x non è puntuale’ . Questa dottrina è la base del nuovo lavoro nella seconda edizione dei Principia Mathematica .

1 The  Monist 1918 e il 1919.

Nessuna di queste teorie sembra del tutto soddisfacente, anche se nessuna delle due possa essere confutata. Il punto di vista di Russell, infatti, comporta difficoltà nel rapporto con le nostre relazioni cognitive con gli universali, per cui era stato respinto nella prima edizione dei Principia, ma queste difficoltà mi sembrano, come ora a Russell, affatto insormontabili. Ma non potevo discuterne qui senza intraprendere innumerevoli questioni irrilevanti rispetto ai punti principali che desidero esaminare.

Né l’una né l’altra teoria, quindi, può essere confutata, ma ad entrambe possono essere sollevate obiezioni che sembrerebbero avere una certa forza. Per esempio, Russell insiste che in una relazione tra due termini non può esserci un terzo termine che si intrometta tra questi, perché allora non sarebbe affatto una relazione, e il solo elemento realmente relazionale consisterebbe nelle relazioni tra questo nuovo termine e i due termini originali. Questo è il tipo di considerazione da cui Bradley deduce il suo regresso all’infinito, che Russell a quanto pare ora approva.

Johnson potrebbe rispondere che per lui l’elemento di connessione o strutturale non è la relazione, ma i legami caratterizzanti e di accoppiamento; ma questi legami restano gli oggetti più misteriosi. Si potrebbe anche obiettare che Johnson non costruisce particolari e universali abbastanza diversi, o prende in considerazione l’incompletezza peculiare degli aggettivi che appare nella possibilità di anteporre ad essi l’ ausiliare ‘essere ‘; ‘essere rosso’, ‘ essere un uomo ‘ non sembrano cose reali come una sedia e un tappeto .

Contro Russell potrebbe essere domandato come possono esistere oggetti come i suoi universali, che contengono la forma di una proposizione e così sono incompleti. In un certo senso, si potrebbe insistere, tutti gli oggetti sono incompleti; e non possono verificarsi nei fatti, salvo in combinazione con altri oggetti, e contengono le forme di proposizioni di cui sono componenti. In che modo gli universali lo fanno più di qualsiasi altra cosa?

Evidentemente, tuttavia, nessuno di questi argomenti sono davvero decisivi, e la posizione è estremamente insoddisfacente per chiunque con una reale curiosità in merito a una questione così fondamentale .

In questi casi è una massima euristica che la verità non si trova in una dei due punti di vista controversi ma in qualche terza possibilità su cui non si è ancora riflettuto, che possiamo scoprire solo rifiutando qualcosa assunto come ovvio da entrambi i contendenti.

Entrambe le teorie controverse fanno un presupposto importante che, a mio avviso, deve essere solo esaminato per dubitarne.

Esse assumono una fondamentale antitesi tra soggetto e predicato, che se una proposizione è composta da due termini accoppiati, questi due termini devono funzionare in diversi modi, uno come soggetto, l’altro come predicato. Così in ‘ Socrate è saggio ‘ , Socrate è il soggetto, saggio il predicato. Ma supponiamo che noi si giri la proposizione e si dica ‘ la Sapienza è una caratteristica di Socrate’, allora la saggezza, l’ex predicato, è ora il soggetto . Ora mi sembra chiaro come qualsiasi cosa può esserlo nella filosofia che le due frasi ” Socrate è saggio ‘, ‘ La saggezza è una caratteristica di Socrate ‘ affermano lo stesso fatto ed esprimono la stessa proposizione. Esse non sono, ovviamente, la stessa frase, ma hanno lo stesso significato, come due frasi in due lingue diverse possono avere lo stesso significato. Quale frase usiamo è una questione sia di stile letterario, o del punto di vista da cui ci avviciniamo al fatto. Se il centro del nostro interesse è di Socrate diciamo ‘ Socrate è saggio ‘, se stiamo discutendo sulla saggezza possiamo dire ‘ La saggezza è una caratteristica di Socrate ‘, ma qualsiasi cosa diciamo intendiamo la stessa cosa. Ora, di una di queste frasi ‘ Socrate ‘ è il soggetto , nell’altra ‘ la saggezza ‘; e così di quale delle due è soggetto, e di quale predicato, dipende da quella particolare frase che usiamo per esprimere la nostra proposizione, e non ha nulla a che fare con la natura logica di Socrate o della saggezza, ma è del tutto una questione per i grammatici. Allo stesso modo, con un linguaggio sufficientemente elastico qualsiasi proposizione può essere espressa in modo che uno qualsiasi dei suoi termini sia il soggetto. Quindi non vi è alcuna distinzione essenziale tra il soggetto di una proposizione e il suo predicato, e nessuna classificazione fondamentale di oggetti può essere basata su una tale distinzione.

Non pretendo che l’argomento di cui sopra sia immediatamente conclusivo; quello che io sostengo è che si gettano dubbi su tutte le basi della distinzione tra particolare e universale come si deduce da quella tra soggetto e predicato, e che la questione richiede un nuovo esame. Si tratta di un punto che è stato spesso presentato da Russell che i filosofi sono molto suscettibili di essere tratti in inganno dalla costruzione soggetto-predicato della nostra lingua. Essi hanno supposto che tutte le proposizioni devono essere di forma soggetto-predicato, e così sono stati indotti a negare l’esistenza di relazioni. Io sostengo che quasi tutti i filosofi, tra cui lo stesso Russell, sono stati ingannati dalla lingua in un modo di molto di più vasta portata di questo; che tutta la teoria dei particolari e universali è dovuta allo scambiare per una caratteristica fondamentale della realtà ciò che è solamente una caratteristica del linguaggio.

Dunque, esaminiamo da vicino questa distinzione tra soggetto e predicato, e per semplicità seguiamo Johnson e includiamo le relazioni tra predicati e i loro termini tra i soggetti. La prima domanda che dobbiamo porci è questa: quali proposizioni sono quelle che hanno un soggetto o soggetti e un predicato? È questo il caso di tutte le proposizioni o solo di alcune? Prima, però, di rispondere a questa domanda, dobbiamo ricordarci che il compito su cui siamo impegnati non è puramente un compito di grammatica inglese; non siamo bambini di scuola che analizzano frasi sul soggetto, l’estensione del soggetto, complemento e così via, ma siamo interessati non tanto nelle frasi stesse, quanto in quello che significano, da cui speriamo di scoprire la natura logica della realtà.

Quindi dobbiamo cercare i significati di soggetto e predicato che non sono puramente grammaticali, ma che hanno un vero e proprio significato logico.

Cominciamo con una certa proposizione come ‘ O Socrate è saggio o Platone è stupido ‘. A questa, probabilmente si sarà d’accordo, il concetto di soggetto e predicato è inapplicabile; ma può essere applicabile alle due parti ‘ Socrate è saggio ‘, ‘ Platone è sciocco ‘, ma l’intero ‘ O Socrate è saggio o Platone è sciocco ‘ è una proposizione alternativa e non una proposizione con un soggetto o predicato. Ma a questo qualcuno può fare la seguente obiezione: in una tale proposizione possiamo assumere qualsiasi termine ci pare, diciamo Socrate, essere il soggetto.

Il predicato sarà poi ‘ essere saggio a meno che Platone sia stupido ‘ o ​​la funzione proposizionale x^ è saggio o Platone è stupido ‘ .

La frase ‘ essere saggio a meno che Platone sia sciocco ‘ sta per un complesso universale che si afferma per caratterizzare Socrate. Un tale punto di vista, anche se molto spesso accettato, a me sembra, tuttavia, certamente sbagliato. Al fine di rendere le questioni più chiare prendiamo un caso più semplice, una proposizione nella forma ‘ aRb ‘; allora questa teoria sosterrà che ci sono tre proposizioni strettamente connesse; una afferma che la relazione R intercorra tra i termini a e b, la seconda asserisce il possesso da parte di a di un complesso di proprietà di ‘ avere R  con b ‘ mentre la terza afferma che b ha la proprietà complessa che a ha R con essa (b). Queste devono essere tre diverse proposizioni perché hanno diversi insiemi di costituenti, e ancora che non sono tre proposizioni, ma una proposizione, perché tutte dicono la stessa cosa, e cioè che a ha R con b. Così la teoria degli universali complessi è responsabile di una trinità incomprensibile, senza senso come quella della teologia. (1)

  1. (N.d.t. Questa espressione rivela i danni della cattiva espressione dei principi dottrinari a cui sono stati sottoposti i cristiani nella loro storia. Infatti nei testi di dottrina si definiva Dio come l’essere perfettissimo signore del cielo e della terra in tre persone uguali e distinte. Quindi si poneva il problema di capire come un Dio unitariamente definito potesse essere una trinità. E’ evidente che in questi termini si proponeva semplicemente una contraddizione logica perché la definizione di uno non può mai coincidere con la definizione di tre a meno di modificare l’aritmetica in modo sostanziale con il risultato tangibile di non poterla più usare nella pratica. Il problema è solo di comunicazione in quanto questo dare per nonsenso ed incomprensibile la trinità è un problema solo di comunicazione dottrinaria. La definizione della trinità deriva dalla necessità di dare una descrizione di un Dio trascendente (quindi fuori dal mondo fisico) con le seguenti due caratteristiche fondamentali: libero e Ente relazionale. Infatti L’uomo secondo la teologia giudaico-cristiana è stato creato ad immagine di Dio. E l’uomo è libero e relazionale. E’ abbastanza evidente che l’alternativa di un Dio unitariamente definito e non trascendente ovvero a teologia panteistica è una forma di materialismo che coincide con le motivazioni dell’ateismo. Mi sembra evidente che se tutto il mondo è Dio e quindi è soggetto alle limitazioni spazio-temporali ed etiche del nostro essere non c’è nessuna differenza con l’ateismo in quanto ha connotazioni perfettamente equivalenti. Tra l’altro un mondo così concepito risulta avere la caratteristica di non considerare necessaria la libertà e un’etica di cooperazione tra le persone in quanto tutto è regolato dal caso e lo scopo della vita di ogni singolo uomo sarebbe limitato a ridurre i casi sfavorevoli al minimo, senza poter comunque annullarli per essere l’avversità statisticamente prevalente dei casi contrari ai desiderata. Quindi per descrivere un Dio trascendente e relazionale come l’uomo che non è scindibile dalla sua relazionalità occorre definire l’unico Dio come Ente costituito di Persone in relazione tra loro. Per la definizione di perfezione, quindi non comprendendo in Dio l’egoismo, occorre che questa relazione sia lo scambio di amore tra il Padre ed il figlio mediato dallo Spirito, così come accade nell’uomo in cui lo scambio relazionale tra le persone avviene tramite il linguaggio di cui il sistema proposizionale è un mezzo importantissimo. Quindi come nel linguaggio il significato passa da A a B tramite, ad esempio la logica proposizionale, così l’Essere trasmette la sua essenza al Figlio tramite lo Spirito che, guarda caso, è anche comunicazione in quanto trasmette agli uomini l’indicibile di un Dio trascendente che non governa il mondo, ma fornisce informazione sulla libertà e l’uguaglianza fraterna degli uomini (quindi nelle loro diversità) e li invita all’adesione al Corpo mistico in cui possano partecipare, nelle loro individualità, al circuito di amore di Dio. Dio non può governare il mondo perché altrimenti verrebbe meno un altro polo della similitudine dell’uomo con Dio, ovvero la libertà di vivere e scegliere come meglio crede. L’espressione di Dio è quindi fatta tramite il linguaggio che ne da’ una rappresentazione, per poterne parlare, ma che non può corrispondere alla vera natura di Dio perché trascendente e quindi fuori del mondo spazio-temporale. In questo senso il concetto ha caratteristiche di mistero, ovvero riguarda una realtà che non possiamo esprimere e non perché riguarda una realtà che ci viene tenuta nascosta. E’ proprio la necessità di tenere come supremo principio la libertà che la rivelazione non può andare oltre i termini dei metodi di scelta umani ovvero non può che essere basata sull’informazione e non sul dato fisico diretto che toglierebbe qualsiasi libertà di scelta. Pertanto la presenza di Dio si sostanzierebbe nelle Parola che è il Verbo fatto carne e nella presenza dello Spirito che supporta materialmente la diffusione della Parola. E’ la libera scelta individuale di aderire al circuito dell’amore di Dio o di rifiutarlo. Secondo la teologia cristiana la libertà è nello stesso atto di fede che si concretizza nella fede nella speranza dell’amore di Dio. E quindi è la libera scelta di far parte del mondo di quanti amano il prossimo perché sperano nell’amore di Dio. Questo concetto di voler appartenere ad un gruppo è sempre stato presente negli uomini, spesso con deviazioni antisociali,ma anche con gruppi che seguono non solo l’interesse degli adepti ma che risultano essere anche aperti alle esigenze degli altri. Un esempio è proprio la Apostles Society di Cambridge che perseguiva lo scopo, associando le migliori menti matematiche dell’epoca, di promuovere lo sviluppo intellettuale di tutta l’umanità. Infine, per semplificare: la relazione aRb non può essere interpretata come una terna perché solo insieme è una relazione tra a e b e a nessuno verrebbe in mente di dire che una proposizione sia una e trina.)

Questo argomento può essere rafforzato prendendo in considerazione il processo di definizione, che è il seguente. Per certi scopi ‘aRb ‘ può essere un simbolo inutilmente lungo, così che sarebbe conveniente accorciarlo in ‘ φb . ‘ Questo viene fatto per definizione, φx = aRx, che significa che qualsiasi simbolo nella forma φx deve essere interpretato nel senso che si riferisce al corrispondente simbolo aRx, per il quale è un’abbreviazione. In casi più complessi tale abbreviazione è spesso molto utile, ma se ne potrebbe sempre fare a meno se il tempo e la carta lo permettono. Chi crede negli universali complessi è ora di fronte a un dilemma: è ​​’ φ ‘ , così definito, un nome per la complessa proprietà di x che consiste in a di avere R con x? Se è così, allora φx sarà l’affermazione che x ha questa proprietà; ma sarà una proposizione soggetto-predicato il cui soggetto è x e il predicato φ; e questo non è identico alla proposizione relazionale aRx .

Ma in quanto φx è per ipotesi definita essere l’abbreviazione di aRx questo è assurdo. Perché se una definizione non deve essere interpretata con il significato che il definiendum e il definiens hanno lo stesso significato, il processo di definizione diventa incomprensibile e si perde ogni giustificazione per l’interscambio tra definiens e definiendum a piacere, da cui dipende tutta la sua utilità. Supponiamo invece che ‘ φ ‘ , come sopra definito, non sia un nome per una proprietà complessa; allora come può la proprietà complessa mai diventare oggetto della nostra osservazione, e come possiamo mai parlarne, visto che ‘ φ ‘, il suo unico nome possibile, non è per nulla un nome ma un’abbreviazione per qualcos’altro? E poi che ragione ci può essere per postulare l’esistenza di questo oggetto?

Nonostante questa reductio ad absurdum della teoria, potrebbe valere ancora la pena di indagare la sua origine e sull’essere essa ritenuto da tante persone, tra cui in passato da me stesso, senza che si verifichi per essi di dubitarne. La ragione principale di questo è credo che si trovi nella comodità linguistica; essa ci dà un oggetto che e ‘ il significato ‘ di ‘ φ ‘. Spesso vogliamo parlare di ‘ il significato di ” φ “‘ ed è più semplice supporre che questo è un termine unico piuttosto che riconoscere che si tratta di una questione molto più complicata, e che ‘ φ ‘ ha una relazione di significato non con un oggetto complesso, ma con gli oggetti più semplici, che sono nominati nella sua definizione.

Vi è, tuttavia, un altro motivo per cui questo punto di vista è così popolare, e che è la difficoltà immaginaria che altrimenti sarebbe avvertita nell’uso di una funzione proposizionale variabile.

Come, ci si potrebbe chiedere, dobbiamo interpretare questa affermazione come ‘a ha tutte le proprietà di b ‘, tranne nell’ipotesi che esistano proprietà? La risposta è che deve essere interpretato come il prodotto logico di tutte le proposizioni che possono essere costruite nel seguente modo: prendiamo una proposizione in cui si a si presenta, per esempio φa, scambiamo a con b ed ottenere φb, e poi formiamo la proposizione φb . ⊃ . φa. In realtà non è così semplice come questo, ma una più accurata considerazione di questo coinvolgerebbe una quantità di noiosi dettagli, che quindi sarebbero fuori luogo qui; e possiamo assumere con una sufficiente approssimazione che ‘a ha tutte le proprietà di b ‘ è l’affermazione congiunta di tutte le proposizioni della forma φb . ⊃ . φa, dove non c’è necessità per φ di essere il nome di un universale, in quanto è solo il supporto di una proposizione in cui a si presenta. Di qui la difficoltà è del tutto immaginaria. Si può osservare che lo stesso vale per qualsiasi altro caso di variabili apparenti alcuni dei valori delle quali sono simboli incompleti, e questo può spiegare la tendenza ad affermare che alcuni simboli incompleti di Russell non sono realmente incompleti, ma i nomi di proprietà o di predicati.

Concludo, quindi, che gli universali complessi sono da respingere; e che una certa proposizione come ‘ O Socrate è saggio o Platone sciocco ‘ non ha né soggetto né predicato.

Argomentazioni analoghe valgono per ogni proposizione composta, cioè ogni proposizione contenente determinati termini come ‘e’ , ‘o’ , ‘non’ , ‘ tutto’ , ‘ qualche ‘; e quindi se vogliamo trovare una distinzione logica tra soggetto e predicato da qualche parte sarà nelle proposizioni atomiche, come le chiama Russell, che possono essere espresse da frasi che non contengono nessuna delle parole di cui sopra, ma solo nomi e, forse, una copula.

La distinzione tra soggetto e predicato allora deriverà dai diversi nomi in una proposizione atomica con funzioni differenti; e se questa non è una distinzione puramente grammaticale deve corrispondere ad una differenza nel funzionamento dei vari oggetti in un fatto atomico, in modo che ciò che dobbiamo innanzitutto esaminare è la costruzione del fatto atomico fuori dai suoi componenti. A proposito di questo potrebbero essere suggeriti tre punti di vista: il primo è quello di Johnson secondo cui i componenti sono collegati tra loro da ciò che egli chiama il vincolo che li caratterizza. La natura di questa entità è piuttosto oscura, ma penso che possiamo prenderlo come qualcosa che non è un costituente del fatto, ma rappresentato nel linguaggio della copula ‘ è’, e siamo in grado di descrivere questa teoria sostenendo che la congiunzione sia realizzata da una vera e propria copula .

Poi vi è la teoria di Russell che la congiunzione è realizzata da uno dei costituenti; che in ogni fatto atomico ci deve essere un componente che è per sua natura incompleto o connettivo e, per così dire, tiene gli altri componente insieme. Questo componente sarà un universale, e gli altri i particolari. Infine vi è la teoria di Wittgenstein che non esiste una copula, né un componente apposito connesso, ma che, come egli si esprime, gli oggetti si collegano l’uno all’altro, come gli anelli di una catena.

Dal nostro punto di vista è la seconda di queste teorie che richiede più attenzione; perché la prima e la terza in realtà non spiegano nessuna differenza nella modalità di funzionamento di soggetto e predicato, ma lasciano questo come un mero dogma. Solo nella teoria di Russell ci sarà una differenza intelligibile tra particolare e universale, basata sulla necessità che vi sia in ogni fatto un termine che collega o universale, che corrisponde alla necessità in ogni frase di avere un verbo.

Così è la teoria di Russell che dobbiamo prendere in considerazione per prima.

La grande difficoltà con questa teoria sta nel capire come una sorta di oggetto può essere appositamente incompleto. C’è un significato in cui qualsiasi oggetto è incompleto; cioè che può verificarsi solo in un fatto per un collegamento con uno o più oggetti di tipo opportuno; proprio come qualsiasi nome è incompleto, perché per formare una proposizione dobbiamo unirlo a determinati altri nomi di tipo adatto. Come dice Wittgenstein : “L’oggetto è indipendente, nella misura in cui può verificarsi in tutte le circostanze possibili, ma questa forma di indipendenza è una forma di connessione con il fatto atomico, una forma di dipendenza. (È impossibile per alcune parole presentarsi in due modi diversi, da sole e nella proposizione) ” 1 E Johnson : “In definitiva un universale rappresenta un aggettivo che può caratterizzare un particolare e un particolare rappresenta un sostantivo che può essere caratterizzato da un universale.” 2 Così possiamo ammettere che ‘ saggio ‘ comporta la forma di una proposizione, ma così è per’ Socrate ‘, ed è difficile vedere qualche fondamento per distinguerli tra loro.

Questa è la sostanza della critica di Johnson che Russell non permette che l’aggettivo stia da solo, e che nel trattare ‘ s è p ‘come una funzione di due variabili che assume che gli argomenti non siano s e p , ma s e ‘ Schermata 2013-08-22 alle 18.42.59  è p’.

1 Tractatus logico-philosophicus, 2.0122. “La cosa è indipendente nella misura in cui essa può occorrere in tutte le situazioni possibili, ma questa forma d’indipendenza è una forma di connessione con lo stato di cose, una forma di dipendenza (E’ impossibile l’occorrer di parole in due diversi modi, da sole e nella proposizione) – Einaudi Paperbacks trad. Amedeo G. Conte.

2 Logic Parte I, pag. 11.

In risposta a questa critica Russell, immagino, userebbe due linee di ragionamento, di cui dobbiamo esaminare la validità.

Il primo risiederebbe sulla grande convenienza nella logica matematica del suo simbolismo funzionale, del quale egli potrebbe dire non ci sarebbe nessuna spiegazione se non che questo simbolismo corrisponde alla realtà più da vicino di ogni altro. La sua seconda argomentazione sarebbe che ognuno può avvertire una differenza tra particolari e universali; che la prevalenza del nominalismo ha dimostrato che la realtà degli universali era sempre sospetta, e che questo era probabilmente perché essa differisce dai particolari per essere meno indipendente, meno autosufficiente. Anche che questa era l’unica ragione della differenza tra particolari e universali, che li rendono effettivamente tipi di oggetti diversi, come evidentemente erano, e non semplicemente diversi in relazione a noi o alla nostra lingua. Ad esempio Johnson descrive il particolare che si presenta al pensiero per il suo carattere di essere determinato nel pensiero, e altri potrebbero dire che un particolare sia quello che era significato dal soggetto grammaticale di una frase; e in base a questi punti di vista ciò che era particolare, quello che era universale dipenderebbero da caratteristiche inessenziali della nostra psicologia o del nostro linguaggio.

Prendiamo queste linee di ragionamento in ordine inverso, cominciando con l’avvertire la differenza tra particolare e universale, e rimandando la particolare convenienza simbolica delle funzioni proposizionali. Chiunque, si può dire, vede una differenza tra Socrate e la saggezza. Socrate è una vera entità indipendente, la saggezza una qualità e quindi essenzialmente una qualità di qualcos’altro. La prima cosa da notare su questo ragionamento è che in realtà non riguarda per niente oggetti.

‘ Socrate è saggio ‘ non è una proposizione atomica, e i simboli ‘ Socrate ‘e’ saggio ‘ non sono i nomi di oggetti, ma simboli incompleti. E secondo Wittgenstein, con cui son d’accordo, questo sarà il fatto con qualsiasi altro esempio che può essere suggerito, dal momento che non siamo messi al corrente con alcuni oggetti autentici o proposizioni atomiche, ma semplicemente li deduciamo come presupposto da altre proposizioni. Quindi la distinzione che avvertiamo è quella tra due tipi di simboli incompleti, o costruzioni logiche, e non si può dedurre senza ulteriori indagini che ci sia una qualche corrispondente distinzione tra due tipi di nomi o oggetti.

Noi possiamo, credo, facilmente ottenere un’idea più chiara della differenza tra questi due tipi di simboli incompleti (Wittgenstein le chiama ‘espressioni’), caratterizzate da ‘ Socrate ‘ e ‘ saggio ‘.

Consideriamo quando e perché un’espressione si presenta, per così dire, come una singola unità. Per esempio ‘ aRb ‘ non si divide naturalmente in ‘a’ e ‘ Rb ‘ , e vorremmo sapere perché qualcuno dovrebbe quindi dividere e isolare l’espressione ‘Rb ‘ . La risposta è che se fosse una questione di questa sola proposizione, non ci sarebbe motivo di dividerla in questo modo, ma che l’importanza delle espressioni si pone, come sottolinea Wittgenstein, solo in rapporto alla generalizzazione.

Non è ‘ aRb ‘ ma ‘ ( x ) . xRb ‘ che rende Rb importante.

Nello scrivere ( x ) . xRb usiamo l’espressione Rb per raccogliere insieme l’insieme delle proposizioni xRb che vogliamo affermare essere vere; ed è qui che l’espressione Rb è veramente essenziale, perché è questo che è comune a questo insieme di proposizioni. Se ora ci rendiamo conto che questo è l’uso essenziale delle espressioni, possiamo vedere immediatamente qual è la differenza tra Socrate e saggio. Attraverso l’espressione ‘ Socrate ‘ raccogliamo insieme tutte le proposizioni in cui si verificano, cioè, tutte le proposizioni che dovremmo ordinariamente dire di essere intorno a Socrate, come ‘ Socrate è saggio ‘, ‘ Socrate non è né saggio né giusto ‘. Queste proposizioni sono raccolte insieme come valori di ‘ φ Socrate ‘, dove φ è una variabile.

Consideriamo ora l’espressione ‘ saggio; usiamo questa per raccogliere insieme le proposizioni ‘ Socrate è saggio ‘ , ‘ Platone è saggio ‘ , e così via , che sono i valori di’ x è saggio ‘ . Ma questo non è l’unico insieme che possiamo usare per costruire ‘ saggio’; proprio come abbiamo usato ‘ Socrate ‘ per raccogliere tutte le proposizioni in cui si verificava, possiamo usare ‘ saggio ‘ per raccogliere tutte quelle in cui si verifica questo, comprese non solo quelle come ‘ Socrate è saggio’, ma anche quelle come ‘ né Socrate né Platone sono saggi ‘, che non sono valori di ‘ x è saggio ‘, ma solo della diversa funzione ‘ φ saggio ‘, dove φ è una variabile . Così mentre Socrate dà solo un insieme di proposizioni, saggio ne da’ due: una simile a quella data da Socrate, vale a dire l’insieme di tutte le proposizioni in cui si verifica saggio, e l’altra un insieme più ristretto di proposizioni della forma ‘ x è saggio ‘ .

Questa è ovviamente la spiegazione della differenza che avvertiamo tra Socrate e saggio, che Russell esprime dicendo che con saggio dobbiamo introdurre la forma di una proposizione. Dal momento che tutte le espressioni devono essere completate per formare una proposizione, era già difficile capire come saggio potesse essere più incompleto di Socrate. Ora possiamo vedere che la ragione di questo è che, mentre con ‘ Socrate ‘ abbiamo solo l’idea di completarlo in qualche modo in una proposizione, con ‘ saggio ‘ non abbiamo solo questo, ma anche l’idea di completarlo in un modo particolare, fornendoci non solo una qualsiasi proposizione in cui si presenta saggio, ma anche quella in cui si verifica in un modo particolare, che potremmo chiamare la sua presenza come predicato, come in ‘ Socrate è saggio ‘.

A che cosa è dovuta questa differenza, ed è una vera differenza? Vale a dire, non possiamo fare con ‘ Socrate ‘ quello che facciamo con ‘ saggio’, e usarlo per raccogliere un insieme di proposizioni più ristrette di tutto l’insieme in cui si verifica? È questo impossibile, o è semplicemente che in realtà non lo facciamo mai? Queste sono le domande a cui ora dobbiamo cercare di rispondere. Il modo per farlo sembrerebbe essere il seguente Supponiamo che possiamo distinguere tra le proprietà di Socrate un certo sottoinsieme che possiamo chiamare qualità, l’idea sarebbe più o meno che una semplice proprietà è una qualità. Allora potremmo formare in collegamento con ‘ Socrate ‘ due serie di proposizioni così come possiamo in connessione con ‘ saggio’. Ci sarebbe una più vasta serie di proposizioni in cui ‘ Socrate ‘ si presenta del tutto, che noi diciamo che affermino le proprietà di Socrate, ma anche ci sarebbe un insieme più ristretto che asserisce le qualità di Socrate.

Quindi supponendo che giustizia e saggezza siano qualità, ‘ Socrate è saggio ‘ , ‘ Socrate è giusto ‘ apparterrebbero al gruppo più ristretto e sarebbero i valori di una funzione ‘ Socrate è q ‘. Ma ‘ Socrate non è né saggio né giusto ‘ non asserirebbe una qualità di Socrate, ma solo una caratteristica complessa o di proprietà, e sarebbe solo un valore della funzione ‘ φ Socrate ‘, non di ‘ Socrate è q ‘.

Ma anche se una tale distinzione fra qualità e proprietà può essere logicamente possibile, non sembriamo mai tenerne conto sistematicamente . Qualche luce può essere gettata su questo fatto da un paragrafo in Logic di Johnson in cui egli sostiene che, sebbene ” possiamo costruire correttamente un aggettivo composto da semplici aggettivi, tuttavia la natura di qualsiasi termine con funzione di sostantivo è tale che è impossibile costruire un autentico sostantivo composto”.1 Così dalle due proposizioni ” Socrate è saggio ‘, ‘ Socrate è giusto ‘ possiamo formare la proposizione ‘ Socrate non è né saggio né Socrate è giusto’, o , in breve, ‘ Socrate non è né saggio né giusto’; che ancora, secondo Johnson, afferma che un aggettivo di Socrate, è un valore di ‘ φ Socrate ‘ e ​​giustificherebbe ‘ ( ∃ φ ) . φ Socrate ‘ o’ Socrate ha qualche proprietà ‘.

1 Parte II, p. 61.

Se, d’altra parte, prendiamo le due proposizioni ” Socrate è saggio ‘ , ‘ Platone è saggio ‘ e formiamo da queste ‘ Né Socrate è saggio né Platone è saggio ‘; questo non è un valore di ‘ x è saggio ‘ e non giustificherebbe ‘ ( ∃ x ) . x è saggio ‘, o ‘ Qualcuno è saggio ‘. Quindi, in quanto ‘ Socrate non è né saggio né giusto ‘ giustifica ‘ Socrate ha qualche aggettivo ‘ possiamo dire che ‘ né saggio né giusto ‘ è un aggettivo composto; ma poiché ‘ né Socrate né Platone sono saggi ‘ non giustifica che ‘ qualcuno è saggio ‘ , ‘ né Socrate , né Platone ‘ non può essere un sostantivo composto non di più di quanto qualcuno sia un uomo composto.

Se, tuttavia, noi potessimo formare un insieme di qualità contrapposte a proprietà, ‘ Socrate non è né saggio né giusto ‘ non giustificherebbe ‘ Socrate ha una certa qualità e ‘ né saggio, né giusto’ non sarebbero una qualità. Contro questo Johnson dice che non esiste un criterio universalmente valido con il quale possiamo distinguere le qualità da altre proprietà; e questa è certamente una contesa molto plausibile quando si parla, come noi ora, delle qualità e delle proprietà delle costruzioni logiche come Socrate. Perché la distinzione è solo realmente evidente in relazione ad un autentico oggetto; allora possiamo dire che φ rappresenta una qualità quando φa è una proposizione atomica a due termini, e questo distinguerebbe le qualità da altre funzioni proposizionali o proprietà. Ma quando il soggetto a è una costruzione logica e φa una proposizione composta di cui non conosciamo l’analisi, è difficile sapere che cosa significherebbe chiedendo se φ sia semplice, e chiamandola, se semplice, qualità. Avremmo chiaramente una questione non di assoluta ma di relativa semplicità.

Eppure è facile vedere che, in teoria, una analoga distinzione può certamente essere fatta anche per i simboli incompleti. Prendiamo qualsiasi simbolo incompleto ‘ α’; questo sarà definito non isolatamente, ma in combinazione con qualsiasi simbolo di un certo tipo x . Così potremmo definire che αx significa αRx . Allora questo simbolo incompleto ‘α’ ci darà due insiemi di proposizioni: l’insieme αx ottenuto completandolo nel modo indicato nella sua definizione; e l’insieme generale delle proposizioni in cui α si verifica affatto, vale a dire tutte le funzioni verità delle proposizioni dell’insieme precedente e le proposizioni costanti che non contengono α. Così, nei due casi famosi delle descrizione e delle classi, come trattati in Principia Mathematica, l’insieme più ristretto sarà quello in cui la descrizione o la classe ha una evenienza primaria, l’insieme più ampio quello in cui ha qualche tipo di evenienza primaria o secondaria, dove il termine di evenienza ‘ primaria’ e ‘secondaria’ hanno i significati spiegati in Principia . In sintesi per quanto riguarda qualsiasi simbolo incompleto possiamo distinguere il suo presentarsi primario e secondario, e questa è fondamentalmente la stessa distinzione che abbiamo trovato essere caratteristica dell’aggettivo. Così che qualsiasi simbolo incompleto è in realtà un aggettivo, e quelli che appaiono sostantivi solo lo sono in virtù della nostra mancanza di distinguere o per l’incapacità o per la negligenza le loro evenienze primarie e secondarie. Come esempio pratico prendiamo il caso degli oggetti materiali; siamo abituati a considerarli come sostantivi, vale a dire che noi li usiamo per definire gli insiemi di proposizioni in un modo solo, e non facciamo distinzione tra loro evenienze primarie e secondarie. Almeno nessuno ha introdotto tale differenziazione finché Whitehead ha dichiarato che gli oggetti materiali sono aggettivi degli eventi in cui sono situati, in modo che il verificarsi primario di un oggetto materiale A è in una proposizione ‘ A si trova in E ‘.

Da tali proposizioni come questa possiamo costruire tutte le altre proposizioni in cui A si presenta. Così ‘ A è rosso’ sarà ‘ per tutte le E , A si trova in E implica che il rosso si trova in E ‘, in cui A ha una presenza secondaria. Quindi la distinzione tra un verificarsi primario e secondario non è semplicemente dimostrato come logicamente necessario, ma in questo caso effettuato praticamente.

La conclusione è che, per quanto riguarda i simboli incompleti, la fondamentale distinzione non è tra sostantivo e aggettivo, ma tra un’evenienza primaria e secondaria; e che un sostantivo è semplicemente una costruzione logica tra cui non riusciamo a distinguere le evenienze primarie e secondarie. In modo che essere un sostantivo non è una proprietà oggettiva, ma soggettiva nel senso che non dipende infatti da una qualsiasi mente, ma dagli elementi comuni nelle menti e le finalità di tutti gli uomini .

Questa è la mia prima conclusione, che è credo di una certa importanza nella filosofia della natura e della mente; ma non è la conclusione che che più desidererei sottolineare, e non risponde alla domanda con cui ho iniziato il mio articolo. Perché si tratta di una conclusione sul metodo e la possibilità di dividere alcune costruzioni logiche in sostantivi e aggettivi, essendo questa in relazione con quelle costruzioni logiche che hanno originato per tradizione l’idea di aggettivo e di sostantivo.

Ma la vera domanda in questione è la possibilità non di dividere le costruzioni logiche, ma reali oggetti in particolari e universali, e per rispondere a questo dobbiamo tornare indietro e riprendere il filo del discorso, dove l’abbiamo abbandonato per questa lunga digressione sulle costruzioni logiche .

Abbiamo visto in precedenza che la distinzione tra particolare e universale è derivato da quella tra soggetto e predicato che abbiamo trovato solo che si verifica nelle proposizioni atomiche. Abbiamo poi esaminato le tre teorie delle proposizioni atomiche o meglio, dei fatti atomici, la teoria di un legame di Johnson, di Russell che l’unione è determinata dagli universali dei quali qui deve esisterne uno e solo uno in ogni fatto atomico, e di Wittgenstein secondo cui gli oggetti si uniscono l’uno all’altro come gli anelli di una catena. Abbiamo osservato che di queste teorie solo quella di Russell realmente assegnava una funzione diversa al soggetto e al predicato e così ha dato un significato alla distinzione tra questi, e si è proceduto a discutere questa teoria. Abbiamo trovato che alle critiche di Johnson Russell aveva due risposte possibili; una che è quella di sostenere che la sua sola teoria ha tenuto conto della differenza che avvertiamo esserci tra Socrate e la saggezza, l’altra che la sua notazione è molto più opportuna di qualsiasi altra e deve quindi corrispondere più strettamente ai fatti. Abbiamo poi preso il primo di questi argomenti , e esaminato la differenza tra Socrate e saggezza. Ciò che abbiamo trovato consiste nel fatto che mentre Socrate determinava solo una serie di proposizioni in cui si presenta, saggio determinava due di tali insiemi, l’insieme completo ‘f saggio’, e l’insieme più ristretto ‘ x è saggio ‘. Abbiamo poi esaminato il motivo di questa differenza tra i due simboli incompleti Socrate e saggio, e abbiamo deciso che era di carattere soggettivo e dipendeva da interessi ed esigenze umani.

Quello che dobbiamo ora considerare è se la differenza tra Socrate e saggio ha una tale attinenza sulla composizione dei fatti atomici come Russell asserisce che esso abbia. Possiamo utilmente coniugare questo con la considerazione dell’altro possibile argomento di Russell dalla comodità superiore del suo simbolismo. L’essenza di questo simbolismo, come Johnson ha osservato, consiste nel non lasciare l’aggettivo da solo, ma nel renderlo una funzione proposizionale con il collegarlo a una variabile x. Un possibile vantaggio di questa procedura ad un tempo si suggerisce nei termini del nostro precedente trattamento della differenza tra sostantivo e aggettivo; e cioè che aggiungere la variabile x ci aiuta a fare la distinzione che noi richiediamo di fare nel caso dell’aggettivo, ma non nel caso del sostantivo, fra i valori di φx e quelli di f ( φz circonflesso ) dove f è una variabile. Solo così, si potrebbe dire, possiamo distinguere ( x ) . φx da ( f), f . ( φz circonflesso ). Ma una piccola considerazione è richiesta per vedere che questo vantaggio è molto leggero e di nessuna importanza fondamentale. Si potrebbe facilmente fare la distinzione in altri modi; per esempio determinando che se la variabile è venuta dopo il φ che dovrebbe significare che noi ora l’esprimiamo con φx, ma se prima di φ ciò che esprimiamo con f ( φz circonflesso ); o semplicemente nel decidere di utilizzare le lettere « x ‘ , ‘ y ‘ , ‘ z ‘, in un caso , ‘ f ‘ , ‘ g ‘ , ‘ h ‘, nell’altro.

Ma , sebbene questo supposto vantaggio nella simbologia funzionale sia immaginario, c’è un motivo che lo rende assolutamente indispensabile. Prendete una certa proprietà come ‘ o che abbia una R con a , o che abbia una S con b ‘; sarebbe assolutamente impossibile rappresentare questo con un semplice simbolo ‘ φ ‘. Perché allora come potremmo definire φ? Non potremmo porre φ = Ra . v . Sb perché non sapremmo se gli spazi vuoti erano da riempire con gli stessi o differenti argomenti, e quindi se φ sia una proprietà o una relazione. Invece dobbiamo mettere φx . = . xRa . v . xSb; che spiega non cosa si intende per φ in sé stessa, ma quello che segue da qualsiasi simbolo x è l’abbreviazione di xRa . v . xSb. E questa è la ragione che rende inevitabile l’introduzione delle funzioni proposizionali. Significa semplicemente che in questo caso ‘ φ ‘ non è un nome ma un simbolo incompleto e non può essere definito in isolamento o non può essere lasciato stare da solo.

Ma questa conclusione su xRa . v . xSb non si applica a tutte le funzioni proposizionali. Se φa è una proposizione atomica a due termini, ‘ φ ‘ è il nome del termine diverso da a, e può benissimo stare da solo; così ci si potrebbe chiedere , perché scriviamo ‘ φx ‘ invece di ‘ φ ‘ anche in questo caso? La ragione di questo risiede in una caratteristica fondamentale della logica matematica, la sua estensionalità, e con questo intendo il suo interesse primario nelle classi e nelle relazioni in estensione. Ora, se in qualsiasi proposizione quale che sia cambiamo qualsiasi particolare nome con una variabile, la funzione proposizionale risultante definisce una classe; e la classe può essere la stessa per le due funzioni di forme molto diverse, in una delle quali ‘ φ ‘ è un simbolo incompleto, nell’altra un nome. Quindi la logica matematica, essendo interessata solo nelle funzioni con significato di classi, si vede che non ha la necessità di distinguere questi due tipi di funzioni, perché la differenza tra queste, sebbene del tutto importante in filosofia, non corrisponderebbe ad alcuna differenza tra le classi che essa definisce. Così perché alcuni φ sono incompleti e non possono stare da soli, tutti i φ di devono essere trattati allo stesso modo al fine di evitare complicazioni inutili, l’unica soluzione è quella di non consentire a nessuno di stare da soli.

Tale è la giustificazione pratica di Russell; ma è anche la confutazione della sua teoria, che non riesce ad apprezzare la distinzione tra le funzioni che sono nomi e quelle che sono simboli incompleti, una distinzione che, come osservato in precedenza, sebbene irrilevante per la matematica è essenziale per la filosofia. Non voglio indicare che Russell negherebbe questa distinzione; al contrario è evidente dalla seconda edizione dei Principia che l’accetterebbe; ma penso che la sua teoria attuale degli universali è il residuo della sua precedente incapacità di apprezzare questo.

Si ricorderà che abbiamo trovato due argomenti possibili per la sua teoria degli universali. Uno derivava dall’efficienza della notazione funzionale; questo chiaramente decade perché, come abbiamo visto, la notazione funzionale semplicemente trascura una distinzione fondamentale che non appare interessare il matematico, e il fatto che alcune funzioni non possono stare da sole non è la dimostrazione che tutte non possono stare da sole. L’altro argomento era per la differenza che avvertiamo tra Socrate e saggio, che corrisponde ad una differenza nel suo sistema logico tra particolari e funzioni. Proprio come Socrate determina un insieme di proposizioni, ma saggio due serie, così a determina un insieme φa , ma φz circonflesso i due insiemi φx e f ( φz circonflesso ). Ma a che cosa è dovuta questa differenza tra particolari e funzioni? Anche in questo caso semplicemente al fatto che certe cose non interessano il matematico. Chiunque fosse interessato non solo nelle classi di oggetti, ma anche nelle loro qualità, distinguerebbe tra le altre quelle funzioni che siano nomi; e se abbiamo chiamato gli oggetti di cui le loro qualità sono nomi, e denotato una qualità variabile con q, dovremmo avere non solo l’insieme φa, ma anche l’insieme più ristretto qa, e l’analoga differenza di quella tra ‘ Socrate ‘ e ​​la saggezza ’ scomparirebbe. Dovremmo avere una completa simmetria tra qualità e particolari; ognuno potrebbe avere nomi che potrebbero stare da soli, ognuno determinerebbe due insiemi di proposizioni, perché a determinerebbe gli insiemi qa e φa, dove q e φ sono variabili, e q determinerebbe gli insiemi qx e fq, dove x ed f sono variabili.

Quindi, se non fosse per l’interesse influenzato dai pregiudizi dei matematici egli poteva inventare un simbolismo che era completamente simmetrico per quanto riguarda particolari e qualità; e diventa evidente che non c’è significato nelle parole particolare e qualità; tutto quello di cui stiamo parlando riguarda due differenti tipi di oggetti, tale che due oggetti, uno di ciascun tipo, possono essere unici componenti di un fatto atomico . Essendo i due tipi in ogni modo simmetricamente correlati, nulla può avere senso nel chiamare un tipo il tipo particolare e l’altro il tipo della qualità, e queste due parole sarebbero prive di connotazione.

A questo, però, varie obiezioni potrebbero essere fatte che devono essere brevemente trattate. In primo luogo si può dire che i due termini di un certo fatto atomico devono essere collegati da un legame caratterizzante e/o da una relazione che li caratterizza, che è asimmetrica, e che distingue le loro relazioni in particolari e qualità. Contro questo direi che il rapporto di caratterizzazione è semplicemente una finzione verbale. ‘ q caratterizza a ‘ non significa né più né meno che ‘ a è q ‘ , è semplicemente una forma verbale allungata; e dal momento che la relazione di caratterizzazione non è certamente un costituente di ‘ a è q ‘ non può esserlo del tutto. Per quanto riguarda il collegamento, non riesco a capire che tipo di una cosa sarebbe, e preferisco il punto di vista di Wittgenstein che nel fatto atomico gli oggetti sono collegati tra loro senza l’aiuto di alcun mediatore 1. Ciò non significa che il fatto è semplicemente la raccolta dei suoi costituenti ma consiste nella loro unione senza alcun vincolo di mediazione. C’è un’altra obiezione in più suggerita dalla trattazione di Russell nella nuova edizione dei Principia . Egli ci dice che tutte le proposizioni atomiche sono nelle forme R1 ( x ), R2 ( x , y ), R3 ( x , y , 2 ), ecc., e così possono definire i particolari come termini che possono verificarsi in proposizioni con qualsiasi numero di termini; mentre, naturalmente, una relazione di n termini potrebbe verificarsi solo in una proposizione con n + 1 termini.

1 N.d.t. Si tratta del ripristino del Rasoio di Occam che è un punto fondamentale del sistema logico di Wittgenstein

Ma questo presuppone la sua teoria in merito alla costituzione dei fatti atomici, che ognuno deve contenere un termine di un tipo speciale, chiamato universale; una teoria che abbiamo trovato essere del tutto infondata.

La verità è che non sappiamo e possiamo sapere assolutamente nulla circa le forme delle proposizioni atomiche; noi non sappiamo se alcuni o tutti gli oggetti possono verificarsi in più di una forma di proposizione atomica; e non c’è ovviamente modo di definire una questione di questo genere. Non possiamo nemmeno dire che non ci sono fatti atomici costituiti da due termini dello stesso tipo.

Si potrebbe pensare che questo ci condurrebbe ad un circolo vizioso di contraddizioni, ma una piccola riflessione mostrerà che non lo fa, perché le contraddizioni dovute al lasciare che una funzione sia solo il proprio argomento sorgono quando assumiamo per argomento una funzione contenente una negazione che è quindi un simbolo incompleto non il nome di un oggetto.

In conclusione, cerchiamo di descrivere da questo nuovo punto di vista la procedura del logico matematico. Egli prende qualsiasi tipo di oggetti quale che siano come soggetto del suo ragionamento, e li chiama particolari, intendendo con ciò semplicemente che ha scelto questo tipo per ragionarne in merito, anche se avrebbe potuto ugualmente bene scegliere qualsiasi altro tipo e chiamarli particolari.

I risultati del sostituire i nomi di questi particolari nelle proposizioni con variabili allora li chiamerebbe le funzioni, indipendentemente dal fatto che la parte costante della funzione sia un nome o un simbolo incompleto, perché questo non fa alcuna differenza per la classe che la funzione definisce. L’incapacità di fare questa distinzione ha portato a questi simboli funzionali, alcuni dei quali sono nomi e alcuni incompleti, ad essere trattati tutti ugualmente come nomi di oggetti incompleti o proprietà, ed è responsabile di quella grande confusione nella teoria degli universali . Di tutti i filosofi solo Wittgenstein ha visto attraverso questa confusione e ha dichiarato che sulle forme delle proposizioni atomiche non possiamo sapere assolutamente nulla.

V

NOTE SULL’ARTICOLO PRECEDENTE (1926)

. . . Quando ho scritto il mio articolo ero sicuro che era impossibile scoprire le proposizioni atomiche con un’analisi vera e propria.

Di questo sono ora molto dubbioso, e non posso quindi essere sicuro che esse non possono essere scoperte essere tutte di una o dell’altra di una serie di forme che può essere espressa da R1 ( x ) , R2 ( x , y) , R3 ( x , y , z ) , ecc., nel qual caso potremmo, come Russell ha suggerito, definire i particolari come termini che possono verificarsi in proposizioni di una qualsiasi di queste forme, gli universali come termini che possono presentarsi in una sola forma. Ammetto che questo può essere trovato essere il caso, ma come nessuno può ancora essere certo di quale tipo di proposizione atomica si tratti, questo non si può affermare con certezza; e non c’è una una forte supposizione a suo favore, perché credo che l’argomento del mio articolo stabilisca che nulla del genere può essere conosciuto a priori.

E questa è una questione di una certa importanza, per i filosofi dal momento che Russell ha pensato che, anche se non sapeva in che termini ultimi le proposizioni fossero analizzabili, questi termini devono comunque essere divisibili in universali e particolari, categorie che vengono utilizzate nelle indagini filosofiche come se fosse certo a priori che a queste sarebbero applicabili. Questo certamente sembra essere derivato principalmente dal presupposto che ci deve essere una differenza tra gli oggetti fondamentali analogo a quello che avvertiamo sussistere tra certi termini come Socrate e saggio; e per vedere se questo può ragionevolmente essere sostenuto, dobbiamo scoprire che differenza c’è tra Socrate e saggio analoga alla distinzione operata nel sistema di Russell tra particolari e universali.

Se consideriamo lo sviluppo del sistema della logica di Russell, come esposto nella Premessa alla seconda edizione dei Principia Mathematica, possiamo vedere che differenza ci sia nel suo trattamento dei particolari e degli universali. Troviamo che gli universali si presentano sempre come funzioni proposizionali, che servono a determinare gli insiemi delle proposizioni, in particolare l’insieme dei valori della funzione φx, e l’insieme delle funzioni di funzione f ( φSchermata 2013-08-22 alle 18.42.59 ) (dove f è una variabile). I particolari servono anche per determinare insiemi di proposizioni, ma in questo caso vi è un unico insieme principale, l’insieme delle funzioni del particolare φa ( con φ variabile). Potremmo fare un insieme più ristretto, come Russell sottolinea, utilizzando una variabile qualità, ma non abbiamo bisogno di farlo. Ora, questa è l’unica differenza tra le funzioni di particolari e di universali nel suo sistema, e come troviamo che c’è una precisa differenza simile tra Socrate e saggio, è probabile che sia qui il nucleo della questione. Saggio, come un φx nel sistema di Russell, determina l’intervallo più ristretto di proposizioni ‘ x è saggio ‘ e quello più ampio ‘f saggio’, dove l’ultimo insieme comprende tutte le proposizioni quale che sia in cui si verifica saggio. Socrate, invece , viene utilizzato solo per determinare il più ampio insieme di proposizioni in cui si verifica in qualsiasi modo; non abbiamo un modo preciso di disfarci di un qualsiasi intervallo ristretto. Non possiamo farlo limitandolo a proposizioni in cui Socrate si presenta come soggetto, perché in ogni proposizione in cui si presenta esso può essere considerato come il soggetto: possiamo sempre considerare la proposizione come se dicesse ‘ E’ vero di Socrate che-‘. Il punto è che con Socrate la gamma più ristretta è omessa . . . .

Tuttavia questa differenza tra Socrate e saggio è illusoria, perché può essere dimostrato essere teoricamente possibile realizzare un insieme simile più ristretto per Socrate, sebbene non avessimo mai avuto bisogno di farlo. Tuttavia, una volta che questo fatto viene osservato, la differenza tra Socrate e saggio cade, e cominciamo, come Whitehead, a chiamare Socrate un aggettivo. Se pensate che tutte o quasi tutte le proposizioni sugli oggetti materiali siano funzioni verità di proposizioni sulla loro posizione negli eventi, allora, secondo il mio punto di vista, state considerando gli oggetti materiali come aggettivi di eventi. Perché questo è il vero significato della distinzione tra aggettivo e sostantivo. Non dico che la distinzione è sorta dalla riflessione esplicita circa la differenza in relazione agli insiemi di proposizioni, ma che questa differenza oscuramente avvertita è l’origine della distinzione. Il mio punto di vista è sorprendentemente confermato dall’argomentazione di Whitehead, il quale, avendo considerato gli oggetti materiali simili a saggio nel modo in questione, quindi ha dichiarato che erano aggettivi.

The Foundations of Mathematics di F.P. Ramsey curato da R.B. Braithwaite

3 Mag

copertina 1

 

 

 

Propongo la traduzione di questi appunti editi e curati da Braithwaite per l’importanza che rivestono nella storia dell’ingegneria della conoscenza e per l’indubbio interesse che può suscitare un pensatore di queste caratteristiche per la precisione e la lucidità delle valutazioni. Inoltre sarebbe ora che si riscoprisse la filosofia del “Realismo” che appare largamente condivisibile in termini scientifici ed in grado di sgomberare il campo della scienza dai falsi profeti della filosofia della scienza di origine tedesca che conducono a contraddizioni o false certezze se non a ideologie non democratiche.

In questa parte pubblichiamo:

L’indice

La prefazione di Moore

L’introduzione del curatore Braithwaite

La bibliografia di Ramsey come riportata nel testo

Le note al simbolismo predisposte da Braithwaite

Il capitolo I delle “published papers”

 

PREFAZIONE

 

L’autore dei documenti raccolti in questo volume mi sembra che coniughi brillantezza del tutto eccezionale, con grandissima solidità di giudizio in filosofia. Egli era uno straordinariamente chiaro pensatore: nessuno ha potuto evitare più facilmente di lui il tipo di confusione di pensiero di cui anche i migliori filosofi sono responsabili, e lui era capace di apprendere in modo chiaro, e osservando costantemente, le distinzioni più sottili. Ha avuto, inoltre, un potere eccezionale di trarre conclusioni da una serie complessa di fatti: poteva vedere ciò che segue da questi presi tutti insieme, o almeno quello che potrebbe seguire, nei casi in cui altri non potrebbero trarre una qualunque conclusione. E , con tutto questo, ha prodotto l’impressione di possedere anche il più sano buon senso: la sua sottigliezza e ingegno non lo portano, come sembra aver portato alcuni filosofi, a negare fatti evidenti. Aveva, inoltre, così mi sembrava, un eccellente senso delle proporzioni: poteva vedere di quali problemi fosse il più fondamentale, ed era questo in cui era molto interessato e che egli era molto ansioso di risolvere. Per tutte queste ragioni, e forse anche per altre altrettanto, ho quasi sempre sentito, riguardo a qualsiasi argomento di cui abbiamo discusso, che ha capito molto meglio di me, e dove (come era spesso il caso) non è riuscito a convincermi, io generalmente ho pensato che la probabilità era che aveva ragione lui ed io in errore, e che il mio mancato accordo con lui era dovuto alla mancanza di capacità mentale da parte mia .

Ramsey non era solo eccezionalmente in grado di pensare con chiarezza se stesso; aveva anche una capacità più rara di spiegare chiaramente agli altri ciò che pensava e perché lo pensava. Ci sono molti buoni esempi in questo volume della sua grande capacità di esposizione lucida . Ma a volte sento che non riesce a spiegare le cose chiaramente come avrebbe potuto fare, semplicemente perché non tiene conto che ogni spiegazione è necessaria: non si rende conto che ciò che a lui sembra perfettamente chiaro e semplice può agli altri, meno dotati, offrire molti enigmi. Devo confessare che io personalmente trovo spesso una difficoltà di comprendere del tutto chiaramente cosa intende, nei casi in cui non sembra di essere a conoscenza che qualche difficoltà di qualche tipo si potrebbe trovare. Senza dubbio, in molti di questi casi, alcuni lettori lo capiranno senza difficoltà; ma ho il sospetto che molti saranno nella mia situazione. Nelle ultime due sezioni del volume (le note del 1928 e 1929), dove stava scrivendo soprattutto per se stesso e non dettagliatamente e non spiegando come avrebbe fatto se stesse scrivendo per la pubblicazione, la difficoltà di seguirlo con adeguata comprensione è naturalmente particolarmente grande. Ma anche dove non lo potete capire completamente spesso è possibile capirlo abbastanza da trovarlo di straordinario interesse; e sono convinto che valga la pena di cercare di capirlo. Non c’è dubbio che a volte può fare semplici errori; ma in generale penso che lui sapeva molto bene di cosa si trattava, e, anche se si era sbagliato, aveva ottime ragioni per le opinioni a cui era giunto. Si tratta di una grande disgrazia che la sua morte prematura gli impedì di esporre queste opinioni, e le ragioni di queste, chiaramente come lui, e forse solo lui, le avrebbe espresse.

G. E. MOORE.

Dicembre 1930.

INTRODUZIONE DEL REDATTORE

FRANK PLUMPTON RAMSEY nacque il 22 Febbraio 1903 , e morì il 19 gennaio 1930. Il figlio del presidente del Magdalen, ha trascorso quasi tutta la sua vita a Cambridge , dove è stato successivamente Studente del Trinity, Fellow del King e Docente di Matematica presso l’Università. La sua morte al culmine delle sue capacità priva Cambridge di una delle sue glorie intellettuali e la filosofia contemporanea di uno dei suoi pensatori più profondi .

Benché l’insegnamento della matematica fosse la professione di Ramsey, la filosofia era la sua vocazione. Educato alla logica dei Principia Mathematica, egli fu tra i primi a vedere l’importanza del lavoro del Dott. Wittgenstein (nella traduzione a cui ha dato assistenza); e le sue pubblicazioni sono state basate in gran parte su questo. Ma i saggi precedentemente non stampati e gli appunti raccolti in questo volume lo mostrano muoversi verso una sorta di pragmatismo, e il trattato generale sulla logica su cui in diversi momenti si era impegnato era di avere trattato la verità e la conoscenza come fenomeni puramente naturali da essere spiegati psicologicamente senza ricorrere a relazioni tipicamente logiche. La filosofia di Ramsey, però, era sempre empirica e sperimentale – la sua calma nel distruggere idee appena nate spesso stupì i suoi amici – e le carte che in questo volume sono pubblicate importanti in sé stesse e come promettenti a condurre ad operare in analoghe direzioni e non come l’esposizione di un coerente e completo sistema filosofico .

La sottigliezza e la fertilità del lavoro filosofico di Ramsey come mostrate qui non hanno bisogno di pubblicità; ma dal momento che i suoi due articoli di economia matematica non sono inclusi, ho ottenuto il permesso di J.M. Keynes ‘ di citare la sua comunicazione in The Economic Journal di marzo 1930 : –

” La morte all’età di 26 anni di Frank Ramsey è una pesante perdita – anche se i suoi interessi primari sono stati nella Filosofia e nella Logica Matematica – per la teoria pura della scienza economica.

Dalla tenera età, circa 16 anni credo, la sua mente precoce era intensamente interessata a problemi economici.

Gli economisti che vivono a Cambridge si erano abituati dai suoi tempi universitari a provare le loro teorie sull’acuto filo delle sue facoltà critiche e logiche. Se egli avesse seguito la via più facile di mera inclinazione, io non sono sicuro che non avrebbe scambiato gli esercizi tormentosi dei fondamenti del pensiero e della psicologia, in cui la mente cerca di acchiappare la propria coda, per le deliziose vie del nostro ramo più gradevole delle scienze morali, in cui teoria e realtà, immaginazione intuitiva e giudizio pratico, si fondono in un modo soddisfacente per l’intelletto umano .

” Quando discese dalle sue altezze di pietra abituali, egli viveva ancora senza fatica in una atmosfera più rarefatta rispetto a quella che la maggior parte degli economisti si preoccupano di respirare, e ha gestito l’apparato tecnico della nostra scienza con la semplice grazia di uno abituato a qualcosa di molto più difficile. Ma ha lasciato dietro di sé in stampa (a parte i suoi articoli di filosofia) solo due testimonianze delle sue capacità – i suoi articoli pubblicati  in The Economic Journal in ‘ Un contributo alla teoria della tassazione ‘ marzo 1927 , e in ‘ Una teoria matematica del risparmio ‘ nel dicembre 1928. L’ultimo di questi è, credo , uno dei contributi più notevoli per l’economia matematica mai realizzati, sia per quanto riguarda l’ importanza intrinseca e la difficoltà del suo soggetto, la capacità e l’eleganza dei metodi tecnici utilizzati, e la chiara purezza di illuminazione con cui la mente dello scrittore è sentita dal lettore giocare su questo soggetto. L’articolo è una lettura terribilmente difficile per un economista, ma non è difficile apprezzare come le qualità scientifiche ed estetiche siano combinati in insieme.

“La perdita di Ramsey è, quindi, per suoi amici , per i quali le sue qualità personali unite più armoniosamente con le sue capacità intellettuali,  richiederà un lungo periodo di tempo per dimenticarla.

La sua ingombrante cornice Johnsoniana, la sua spontanea risata gorgogliante, la semplicità dei suoi sentimenti e reazioni, a metà allarmante talvolta e, occasionalmente, quasi crudele nella loro immediatezza e letteralità, la sua onestà mentale e del cuore, la sua modestia, e la sorprendente, facile efficienza della sua macchina intellettuale che si trovava dietro le sue ampie tempie, il volto sorridente, sono state acquisite da noi al culmine della loro eccellenza e prima che il frutto del suo lavoro e della sua vita potesse essere raccolto.”

I saggi raccolti in questo volume si estendono nel tempo dal 1923 al 1929 e presentano lo sviluppo del pensiero di Ramsey dall’età di 20 anni fino alla sua morte. I documenti sulla logica matematica sono posti all’inizio. I, sui fondamenti della matematica, è un tentativo di ricostruire il sistema dei Principia Mathematica in modo che le sue imperfezioni possano essere evitate ma le sue eccellenze mantenute. Con quello che lui chiama una teoria “oggettiva” delle funzioni predicative, Ramsey mostra come le note contraddizioni (sto mentendo, ecc.) possono essere rimosse con l’uso di una Teoria dei Tipi che è più semplice di quella proposto da Bertrand Russell e che rende non necessario assumere un Assioma di Riducibilità al fine di salvare i numeri irrazionali. Inoltre, una “completa estensionalizzazione”, della matematica risolve le difficoltà connesse con l’identità e con l’Assioma Moltiplicativo. Le opere di Ramsey sono quindi nella grande tradizione di Frege , Peano , Whitehead e Russell; e in un certo senso si può dire che completano il loro lavoro sui fondamenti logici della matematica .

In II – un articolo semi-pubblico letto difronte alla  British Association nel 1926 – questo modo di trattare la ” logica ” della matematica è difeso contro il formalismo di Hilbert e l’intuizionismo di Brouwer. La fine di questo documento mostra che Ramsey non era completamente soddisfatto della sua teoria, soprattutto per quanto riguarda l’Assioma dell’Infinito; e nel 1929 si era convertito ad una visione finitista che rifiuta l’ esistenza di un qualsiasi insieme infinito reale e allusioni a questo sono fatte in alcune delle note successive. Il profondo disaccordo di Ramsey con la dottrina di Hilbert della matematica come un gioco con segni privi di significato non gli impedì di dare una buona dose di attenzione al principale dei problemi dei formalisti – che è di trovare un procedimento generale per determinare la coerenza di una formula logica (l’ Entscheidungsproblem) – e III è la soluzione del problema per un insieme di casi particolarmente interessante.

Una percentuale relativamente piccola di lavoro puramente filosofico di Ramsey è stato pubblicato in precedenza. IV si compone di un articolo che nega che ci sia una qualsiasi distinzione definitiva tra particolari e universali , e VI – “Fatti e Proposizioni ” – è l’analisi logica della convinzione. La recensione di Ramsey del libro di Wittgenstein è stampato come appendice.

Questa recensione è stato il primo importante documento filosofico di Ramsey e contiene questioni di grande interesse: ma è stato scritto prima che Ramsey discutesse il libro con il suo autore, e ha ammesso che in molti punti aveva frainteso; così che l’articolo non deve essere preso né come esposizione né come critica dei punti di vista del Tractatus logico-philosophicus stesso.

Tutti i documenti inediti che vengono stampati qui si occupano di temi filosofici. VII è un lungo saggio su Verità e Probabilità scritto alla fine del 1926  gran parte del quale è stato letto al Moral Science Club a Cambridge. Elabora una teoria completamente soggettiva della probabilità e una visione completamente pragmatica dell’induzione.

Ramsey pensava di pubblicare questo saggio separatamente, e si trova in uno stato molto più completo degli altri articoli inediti. Il suo capitolo finale – sulla probabilità nella scienza -non è mai stata scritto. Ho completato il saggio con alcune note su argomenti rilevanti scritte nella primavera del 1928 (VIII). L’ ultima sezione del libro (IX) è costituita da una serie di articoli scritti nell’estate del 1929.

Il primo di questi è un molto serio tentativo di fornire una teoria di teorie e del suo uso nel ragionamento. Seguono una teoria estremamente sottile sulla natura delle proposizioni causali, ulteriori osservazioni sulla probabilità e sulla conoscenza, e una nota sull’essenza della filosofia. Questi saggi, sebbene siano frammentari e abbozzati, mi sembrano visualizzare l’intelligenza di Ramsey nelle sue maggiori capacità.

Il breve articolo stampato come Epilogo è stato letto ad una discussione della società di Cambridge nel 1925: Ramsey non ha cambiato l’atteggiamento verso la vita che egli ha così felicemente e caratteristicamente espresso in questo.

E ‘ di interesse constatare che documenti importanti di Ramsey sono stati omessi da questo volume. Questi sono (1) i due articoli di economia, (2) la maggior parte di un contributo ad un simposio in cui si è occupato principalmente di criticare i precedenti relatori (ma ho ristampato il resto come V), (3) le note per il suo corso annuale di lezioni a Cambridge sui fondamenti della matematica, (4) alcune note su proposizioni generali, la causalità, e la conoscenza scritti nella primavera del 1928 e sostituiti da quelli sugli stessi soggetti dell’estate del 1929 (allusione è fatta in questi a una sua precedente teoria causale), (5) frammenti del 1929 in occasione della sua conversione al finitismo matematico, ulteriori tentativi ad Entscheidungsproblem e frammenti sulle teorie e (6) la bozza dei primi quattro capitoli di un trattato generale sulla logica. Questo lavoro aveva occupato Ramsey intermittentemente durante il 1927 e il 1928, ma era profondamente insoddisfatto di esso, e il materiale preliminare che rimane è piuttosto inadatto per la pubblicazione.

Sono profondamente grato alla signora Lettice Ramsey per il privilegio di correzione di questo libro così come per l’assistenza in ogni fase della sua produzione. Il signor Alister Watson anche che mi ha aiutato molto abilmente nella prova di lettura. I Signori G.H. Hardy, J.M. Keynes, G.E. Moore, M.H.A. Newman , e L. Wittgenstein (con altri di amici di Ramsey ) mi hanno dato preziosi consigli per la scelta degli articoli, anche se io solo sono responsabile per la scelta finale. Le autorità della London Mathematical Society, The Mathematical Association, The Mind Association, e l’Aristotelian Society hanno gentilmente dato il permesso che i documenti precedentemente pubblicati fossero ristampati. In questi e nei documenti pubblicati per la prima volta, ho fatto occasionalmente lievi alterazioni verbali e simboliche per aiutare il lettore. Ma non ho tentato di modificare in qualsiasi misura l’informalità di molte delle note. Né (oltre ad aggiungere una nota sul simbolismo e alcuni riferimenti) ho cercato di alleviare le difficoltà del soggetto. Questo libro è presentato nella speranza che possa stimolare altri a pensare alle cose più difficili del mondo, con po’ di quella semplicità d’animo che ha caratterizzato Frank Ramsey .

R. B. BRAITHWAITE .

CAMBRIDGE .

Giugno e dicembre 1930.

BibliografiaBibliografia 1

 

Note al simbolismo

Note al simbolismo 1

I

I FONDAMENTI DELLA MATEMATICA

PREFAZIONE

PREFAZIONE

Lo scopo di questo lavoro è quello di dare una relazione soddisfacente dei Fondamenti della Matematica secondo il metodo generale di Frege , Whitehead e Russell. Seguendo queste autorità, ritengo che la matematica sia parte della logica, e quindi appartengo a quella che può essere chiamata la scuola logica in opposizione alle scuole formaliste e intuizioniste. Ho quindi assunto i Principia Mathematica come base per la discussione e la modifica; e credo di aver io stesso scoperto come, utilizzando il lavoro di Wittgenstein, può essere reso libero dalle forti obiezioni che hanno causato il suo rifiuto da parte della maggioranza delle autorità tedesche, che hanno abbandonato del tutto la sua linea di approccio.

CONTENUTI

( 1 ) INTRODUZIONE

( 2 ) PRINCIPIA MATEMATICA

( 3 ) FUNZIONI PREDICATIVE

( 4 ) FUNZIONI IN ESTENSIONE

( 5 ) GLI ASSIOMI

 

1 . INTRODUZIONE

In questo capitolo ci occuperemo della natura generale della matematica pura, 1 e come si distingue da altre scienze. Qui ci sono davvero due categorie distinte di cose di cui deve essere dato conto – le idee o i concetti della matematica, e le proposizioni della matematica. Questa distinzione non è né artificiale né inutile, perché la grande maggioranza degli scrittori sull’argomento hanno concentrato la loro attenzione sulla spiegazione dell’una o dell’altra di queste categorie, ed erroneamente supposto che una spiegazione soddisfacente dell’altra seguirebbe immediatamente dalla prima.

1 Nel futuro ‘Matematica’ significherà sempre ‘ matematica pura ‘.

Così la scuola formalista, della quale il rappresentante più eminente è ora Hilbert, si è concentrata sulle proposizioni della matematica , come ‘2 + 2 = 4’ . Hanno asserito che queste siano formule prive di significato da manipolare secondo certe regole arbitrarie, e sostengono che la conoscenza matematica consiste nel sapere quali formule possono essere derivate da quali altre coerentemente con le regole. Tali essendo le proposizioni della matematica, la loro valutazione  dei loro concetti, per esempio il numero 2, ne segue immediatamente.

‘2 ‘ è un segno privo di significato che si verifica in queste formule senza significato. Ma , qualsiasi cosa si possa pensare di questo come una valutazione di proposizioni matematiche, questo è ovviamente come teoria dei concetti matematici senza speranza; perché questi si verificano non solo in proposizioni matematiche, ma anche in quelle della vita quotidiana. Così ‘2 ‘ si verifica non solo in ‘2 + 2 = 4 ‘, ma anche in ‘ è a 2 miglia dalla stazione ‘, che non è una formula senza significato, ma una proposizione significativa, in cui ‘ 2 ‘ non può essere concepito come un segno senza significato. Né ci può essere alcun dubbio che ‘2 ‘ venga usato nello stesso senso nei due casi, perché possiamo usare ‘2 + 2 = 4’ per dedurre da ‘ Si trova a due miglia dalla stazione ferroviaria e a due miglia da Gogs ‘ che ‘ è a quattro miglia da Gogs passando dalla stazione ‘ , in modo che questi significati ordinari di due e di quattro sono chiaramente coinvolti nel ‘2 + 2 + 4 ‘. Così la senza speranza inadeguata teoria formalista è , in qualche misura , il risultato di considerare solo le proposizioni della matematica e trascurare l’analisi dei suoi concetti, sui quali una luce supplementare può essere generata dal loro verificarsi al di fuori della matematica nelle proposizioni della vita quotidiana.

Oltre al formalismo, ci sono due principali atteggiamenti generali sui fondamenti della matematica: quella degli intuizionisti o finitisti, come Brouwer e Weyl nei suoi recenti lavori , e quella dei logici – Frege , Whitehead e Russell. Le teorie degli intuizionisti certamente implicano di rinunciare a molti dei metodi più fecondi di analisi moderni, senza nessun motivo, come sembra a me, tranne che certi metodi non riescano a conformarsi ai loro personali pregiudizi​​. Essi, quindi, non pretendono di dare un fondamento alla matematica come la conosciamo, ma solo per un insieme più ristretto di verità che non è stato ancora chiaramente definito. Restano i logici il cui lavoro è culminato in Principia Mathematica. Le teorie messe in evidenza qui  sono generalmente respinte per ragioni particolari, in particolare le difficoltà apparentemente insormontabili legate all’Assioma di Riducibilità. Ma questi difetti nel dettaglio mi sembrano essere i risultati di un difetto importante in linea di principio, sottolineato per primo da Wittgenstein.

La scuola logica si è concentrata sull’analisi dei concetti matematici, che ha dimostrato di essere definibile in termini di un numero molto limitato di concetti logici fondamentali; e , avendo costruito questa relazione sui concetti della matematica hanno subito dedotto una considerazione sulle proposizioni matematiche – vale a dire, che erano quelle proposizioni vere in cui si presentano solo concetti matematici o logici. Così Russell, in The Principles of Mathematics, definisce la matematica pura come ‘ la classe di tutte le proposizioni della forma “p implica q” , dove p e q sono proposizioni contenenti una o più variabili, le stesse nelle due proposizioni, e né p né q non contiene qualsiasi costante eccetto costanti logiche. 1

1 Russell , The Principles of Mathematics (1903), p. 3

Questa riduzione della matematica alla logica simbolica è stata giustamente descritta da Russell come una delle più grandi scoperte del nostro tempo 1;  ma non era la fine della questione, come egli sembrava supporre, perché era ancora lontano da una concezione adeguata della natura della logica simbolica, a cui la matematica era stata ridotta. Non mi riferisco alla sua semplice teoria che le costanti logiche siano nomi di oggetti reali (che, da allora, ha abbandonato), ma alla sua convinzione che solo debba essere una proposizione di logica o matematica 3 qualsiasi proposizione che possa essere espressa usando termini logici. 2 Penso che la questione si possa rendere chiara descrivendo la classe di proposizioni in questione come le proposizioni completamente generali, evidenziando il fatto che non sono su eventuali oggetti o relazioni particolari, ma su alcuni o tutti gli oggetti e tutte le relazioni. E ‘ davvero evidente che non tutte queste proposizioni sono proposizioni della matematica o della logica simbolica.

Prendete per esempio ‘ due cose qualunque differiscono in almeno trenta modi ‘ , questa è una proposizione assolutamente generale, essa potrebbe essere espressa come una implicazione che coinvolge solo costanti logiche e variabili, e potrebbe anche essere vera. Ma nessuno potrebbe considerarla come una verità matematica o logica; è completamente diversa da una certa proposizione come ‘due oggetti qualsiasi insieme con qualche altri due oggetti fanno quattro, ‘ che è una verità logica e non solo una verità empirica. Secondo la nostra filosofia  noi le consideriamo diversamente chiamando l’una contingente, l’altra una proposizione necessaria, oppure l’una una vera e propria proposizione, l’altra una pura tautologia; ma dobbiamo tutti essere d’accordo che ci sia qualche differenza sostanziale tra le due, e che una definizione delle proposizioni matematiche deve comprendere non solo le generalità assolute, ma pure qualche ulteriore proprietà. Questo è sottolineato, con riferimento a Wittgenstein, nell’Introduzione alla Introduction to Mathematical Philosophy 4 di Russell; ma non vi è alcuna traccia di esso in Principia Mathematica , né Russell sembra aver capito la sua enorme importanza, per esempio, nella considerazione delle proposizioni primitive.

1 Loc . cit . , p . 5.

2 ovvero  variabili e costanti logiche.

3 trascuro qui , come altrove , la condizione arbitraria e banale che la proposizione deve essere della forma ‘ p implica q ‘.

4 p . 205 .

Nel passaggio riferito nell’ Introduction to Mathematical Philosophy, Russell distingue tra proposizioni che possono essere enunciate in termini logici da quelle che logica può affermare essere vere, e dà come ulteriore caratteristica di queste ultime che sono tautologiche con un significato che non può definire. È ovvio che una definizione di questa caratteristica è essenziale per stabilire chiaramente il nostro soggetto, dal momento che il concetto da definire è uno dei lati essenziali delle proposizioni matematiche – il loro contenuto e la loro forma. Il loro contenuto deve essere completamente generale e la loro forma tautologica .

I formalisti  hanno trascurato del tutto il contenuto e rendono la matematica priva di significato matematico, i logici trascurato la forma e realizzano una matematica che consiste di qualsiasi vere generalizzazioni; solo tenendo conto di entrambi gli elementi e considerandola come composta di generalizzazioni tautologiche possiamo avere una teoria adeguata .

Ora dobbiamo spiegare una definizione di tautologia che è stata data da Wittgenstein nel suo Tractatus Logico-Philosophicus e costituisce uno dei più importanti dei suoi contributi alla materia. Nel fare questo non possiamo evitare qualche spiegazione della sua teoria sulle proposizioni in generale.

Dobbiamo iniziare con la nozione di un proposizione atomica 1; questa è quella che non può essere analizzata in termini di altre proposizioni e potrebbe consistere di soli nomi senza costanti logiche. Ad esempio, unendo ‘φ ‘ , il nome di una qualità, ad ‘a’ , il nome di un particolare, e scrivendo, ‘ φa’, abbiamo una proposizione atomica, che afferma che il particolare ha una certa qualità. Quindi, se trascuriamo il fatto che ‘ Socrate ‘ e ‘ saggio ‘ sono simboli incompleti e li consideriamo come nomi, ‘Socrate è saggio’ è una proposizione atomica; ma ‘Tutti gli uomini sono saggi’, ‘Socrate non è saggio’, non sono proposizioni atomiche.

1 Wittgenstein chiama queste ‘proposizioni elementari’, le ho chiamate ‘ atomiche ‘, per seguire Russell che usa ‘ elementare ‘ con un significato diverso .

Supponiamo adesso di avere, ad esempio, n proposizioni atomiche p , q , r, … Per quanto riguarda la loro verità o falsità vi sono al massimo 2n possibilità mutuamente esclusive, che potremmo organizzare in una tabella come questa (T significa verità, e F falsità, e abbiamo preso n = 2 per brevità) .

tabella 1 pag6

Queste 2n possibilità si chiameranno le possibilità di verità delle n proposizioni atomiche. Si potrebbe desiderare di scegliere qualsiasi sottoinsieme di esse, e affermare che esiste una possibilità fuori di questo sottoinsieme, che è, di fatto , realizzata – che è , l’esprimere il nostro accordo con alcune delle possibilità e il nostro dissenso con il resto. Possiamo farlo impostando i segni T e F a fronte delle possibilità con cui siamo d’accordo o in disaccordo, rispettivamente. In questo modo si ottiene una proposizione.

Così  (ad esempio)

tabella 2 pag6

è la proposizione ‘ Né p né q sono vere ‘ , o ‘ p è incompatibile con q’, perché abbiamo ammesso tutte le possibilità tranne la prima che abbiamo non ammessa.

Allo stesso modo

tabella 1 pag7

è la proposizione ‘ se p , allora q ‘.

Una proposizione che esprime accordo e disaccordo con la verità possibili di p , q , … (che è necessario non siano atomiche) viene chiamato una funzione verità degli argomenti p , q , … O, più precisamente, P si dice che sia la stessa funzione verità di p , q … come R è di r, s, … se P esprime accordo con le possibili verità di p, q,  che corrispondono per sostituzione a p con r, q con s, ….. alle possibili verità di r, s, … con cui R esprime accordo . Così ‘ p e q ‘ è la stessa funzione  verità di p , q come ‘ r e s è di r, s essendo in ciascun caso l’unica possibilità consentita che entrambi gli argomenti siano veri. Wittgenstein ha percepito che , se accettiamo questo sistema di funzioni verità che esprimono accordo e disaccordo con le possibilità di verità, non c’è motivo per cui gli argomenti di una funzione verità non dovrebbero essere in numero infinito.1 Dal momento che nessuno scrittore precedente ha ritenuto le funzioni verità capaci di più di un numero finito di argomenti, questa è la più importante innovazione.

1 Così la somma logica di un insieme di proposizioni è la proposizione in cui almeno una dell’insieme è vera, ed è irrilevante che l’insieme sia finito o infinito. D’altra parte, una somma algebrica infinita non è per niente affatto una somma, ma un limite, e quindi non può essere trattata come una somma tranne che sottoponendola ad alcune restrizioni.

Naturalmente se gli argomenti sono infiniti in numero non tutti possono essere enumerati e scritti  separatamente; ma non vi è alcuna necessità per noi di enumerarli se possiamo determinarli in qualsiasi altro modo, come potremmo utilizzando le funzioni proposizionali.

Una funzione proposizionale è un’espressione della forma ‘Schermata 2013-10-04 alle 22.51.00 ‘ , che è tale che essa esprime una proposizione quando un qualche simbolo (di un certo appropriato tipo logico che dipende da f) è sostituito da ‘Schermata 2013-08-22 alle 18.42.59 ‘ . Così ‘Schermata 2013-08-22 alle 18.42.59 è un uomo ‘ è una funzione proposizionale.  Possiamo usare le funzioni proposizionali per raccogliere insieme la gamma di proposizioni che rappresentano tutti i valori della funzione per tutti i possibili valori di x. Così ‘  Schermata 2013-08-22 alle 18.42.59    è un uomo ‘ raccoglie insieme tutte le proposizioni’ a è un uomo ‘ , ‘ b è un uomo ‘ , ecc. Avendo ora per mezzo di una funzione proposizionale definito un insieme di proposizioni, possiamo, utilizzando una notazione appropriata affermare la somma logica o il prodotto logico di questo insieme. Così , scrivendo ‘ ( x ) . fx ‘ asseriamo il prodotto logico di tutte le proposizioni della forma ‘ fx’; scrivendo ‘ (∃ x ) . fx ‘ asseriamo la loro somma logica. Così ‘ ( x ) . x è un uomo ‘ significherebbe ‘ ogni oggetto è un uomo ‘; ‘ ( ∃ x ) . x è un uomo‘, ‘ Qui c’è qualcosa  che è un uomo ‘ . Nel primo caso noi ammettiamo solo la possibilità che tutte le proposizioni della forma ‘x è un uomo ‘ siano vere; nel secondo si esclude solo la possibilità che tutte le proposizioni della forma ‘ x è un uomo ‘ siano false.

Così proposizioni generali contenenti ‘ tutti ‘ e ‘ qualche ‘ si è trovato essere funzioni verità, per quegli argomenti che non vengono enumerati, ma forniti in un altro modo. Ma dobbiamo guardarci qui da un potenziale errore. Prendete una certa proposizione come ‘ Tutti gli uomini sono mortali ‘; questo non è come si potrebbe a prima vista supporre il prodotto logico delle proposizioni ‘x è mortale ‘ per certi valori di x che sono gli uomini. Tale interpretazione può essere facilmente dimostrato essere errata ( v., ad esempio, Principia Mathematica, 1 , 1st edizione p. 47 , 2a ed., p. 45 ). ‘ Tutti gli uomini sono mortali ‘ deve essere interpretato nel significato ‘ ( x ) . se x è un uomo , x è mortale ‘  cioè è il prodotto logico di tutti i valori della funzione ‘ se x è un uomo , x è mortale ‘.

Wittgenstein sostiene che tutte le proposizioni sono, nel senso definito, funzioni verità di proposizioni elementari. Questo è difficile da dimostrare , ma per suo proprio merito estremamente plausibile; ciò esprime il concetto che, quando affermiamo qualcosa, stiamo dicendo che esiste una possibilità massima da un certo gruppo di possibilità che si è realizzata, non una delle residue possibilità. Inoltre si applica a tutte le proposizioni che possono essere espresse nel simbolismo dei Principia Mathematica; dal momento che queste vengono costruite da proposizioni atomiche utilizzando in primo luogo congiunzioni come ‘ se ‘ , ‘e’ , ‘o’ , e secondariamente vari tipi di generalizzazioni (variabili apparenti). Ed entrambi questi metodi di costruzione sono stati indicati come metodi che creano funzioni verità.1

1 La forma ‘A crede p ‘ sarà forse suggerita come dubbia. Questo chiaramente non è una funzione verità di ‘ p ‘ , ma può tuttavia essere una di altre proposizioni atomiche.

Da questa indicazione vediamo quando due simboli proposizionali sono da considerare come casi della stessa proposizione – vale a dire , quando esprimono accordo e disaccordo con gli stessi insiemi di possibilità di verità di proposizioni atomiche.

Così nel simbolismo dei Principia Mathematica

‘ p ⊃ :q ∼ p . ⊃. q ‘, ‘ q v: p . ~ p ‘

sono entrambi modi più complicati di scrivere ‘ q ‘ .

Dato un qualsiasi insieme di n proposizioni atomiche come argomenti , vi sono 2n corrispondenti possibilità di verità, e quindi 2 al quadrato elevato a n sottoclassi della loro possibilità di verità, e così 2 al quadrato elevato a n funzioni di verità di n argomenti, uno che esprime accordo con ogni sotto – classe e disaccordo con le restanti. Ma tra questi 2 al quadrato elevato a n ci sono due casi estremi di grande importanza: quello in cui esprimiamo accordo con tutte le possibilità di verità, l’altra in cui esprimiamo accordo con nessuna di esse. Una proposizione del primo tipo è chiamato tautologia, del secondo contraddizione . Tautologie e contraddizioni non sono proposizioni vere, ma casi degeneri. Possiamo, forse, chiarire questo più facilmente prendendo il caso più semplice, quando c’è un solo argomento . La tautologia è

figura 1 pag 10

Questo non afferma davvero assolutamente nulla; non ti lascia più saggio di quello che ti ha trovato. Tu non sai niente circa il tempo , se tu sai che piove o non piove.

La contraddizione è

figura 2 pag10

i.e ‘ p non è né vero né falso ‘.

Questo è chiaramente autocontraddittorio e non rappresenta un possibile stato di cose la cui esistenza potrebbe essere affermata.

Tautologie e le contraddizioni possono essere di tutti i gradi di complessità; per dare altri esempi ‘(x) . φx : ⊃ : φa ‘ è una tautologia , ‘ ~ ( ∃x ) φx : φa ‘ una contraddizione.Evidentemente negando una contraddizione otteniamo una tautologia, e negando una tautologia otteniamo una contraddizione. E ‘ importante vedere che le tautologie non sono semplicemente proposizioni vere, anche se per molti scopi  possono essere trattate come proposizioni vere. Una reale proposizione asserisce qualcosa sulla realtà, ed è vera se la realtà è come è asserito essere. Ma una tautologia è un simbolo costruito in modo da non dire assolutamente nulla sulla realtà, ma per esprimere la totale ignoranza con il concordare con ogni possibilità.

1 Wittgenstein , Tractatus Logico-Philosophicus , 4.461 : La proposizione mostra ciò che dice; la tautologia e la contraddizione, che dicono nulla. La tautologia non ha condizioni di verità, perché è incondizionatamente vera; e la contraddizione è sotto nessuna condizione vera. Tautologia e contraddizione sono prive di senso. (Come il punto onde due frecce divergono in direzione opposta). (Ad esempio non so nulla sul tempo se so che piove o non piove). L.W. Tractatus Einaudi Paperbacks trad. Amedeo G. Conte.

L’assimilazione di tautologie e contraddizioni a proposizioni vere e false rispettivamente risulta dal fatto che tautologie e contraddizioni possono essere presi come argomenti di funzioni verità, proprio come le proposizioni ordinarie, e perché determinando la verità o falsità delle funzioni verità, le tautologie e le  contraddizioni fra i loro argomenti devono essere annoverati veri e falsi rispettivamente. Così, se ‘ t ‘ fosse una tautologia , ‘c’ una contraddizione , ‘ t e p ‘, ‘Se t , allora p’ , ‘c o p ‘ sarebbero la stessa cosa di ‘p’, e ‘ t o p ‘ , ‘ se c, allora p ‘ sarebbero tautologie.

Abbiamo qui, grazie a Wittgenstein , a cui è dovuta l’intera analisi, un significato chiaramente definito di tautologia; ma è questo, ci si può chiedere , il significato in cui abbiamo trovato che la tautologia sia una caratteristica essenziale delle proposizioni della matematica e della logica simbolica ? La questione deve essere decisa dal confronto. Le proposizioni della logica  e le tautologie della matematica hanno il significato dato da Wittgenstein ?

Cominciamo considerando non le proposizioni della matematica, ma quelle dei Principia Mathematica.1 Queste sono ottenute dal processo di deduzione da certe proposizioni primitive, che ricadono in due gruppi – quelle espresse in simboli e quelle espresse in parole. Quelli espresse in parole sono quasi tutte nonsensi secondo la Teoria dei Tipi , e dovrebbero essere sostituite da convenzioni simboliche. Le vere proposizioni primitive, quelle espresse in simboli, sono, con una sola eccezione, tautologie nel senso di Wittgenstein. Così, come il processo di deduzione è tale che da tautologie seguono solo tautologie, se non fosse per un unico difetto l’intera struttura sarebbe composta da tautologie. Il difetto è ovviamente l’Assioma dia Riducibilità, che è , come si vedrà in seguito, 2 una vera e propria proposizione, la cui verità o falsità è una bruta questione di fatto, non di logica.

1 Questa distinzione è fatta solo perché Principia Mathematica potrebbe essere una errata interpretazione della matematica; nei principi penso che sia una cosa corretta.

2 Cfr. capitolo V.

Si tratta, quindi, non di una tautologia in un qualsiasi senso, e la sua introduzione in matematica è imperdonabile. Ma supponiamo che si potesse farne a meno, e i Principia Mathematica fossero modificati di conseguenza, questi sarebbero composti interamente di tautologie con il significato di Wittgenstein. E quindi, se Principia Mathematica è correttamente come fondamento e interpretazione della matematica, è secondo il significato di tautologia di Wittgenstein che la matematica è tautologica.

Ma l’adeguatezza dei Principia Mathematica è una questione di dettaglio; e, dal momento che abbiamo visto che contiene un gravissimo difetto, non si può più essere sicuri che la matematica sia quel genere di cose che Whitehead e Russell suppongono che sia, o quindi che consista di tautologie nel senso di Wittgenstein. Una cosa è però chiara: che la matematica non consiste di vere proposizioni o asserzioni di fatto che siano basate su prove induttive, come è stato proposto di basare l’Assioma della Riducibilità, ma è in un certo senso necessaria o tautologica. Nella vita reale, come dice Wittgenstein , ” non vi è mai una proposizione matematica di cui abbiamo bisogno, ma usiamo proposizioni matematiche solo per dedurre da proposizioni che non appartengono alla matematica ad altre che ugualmente non appartengono alla matematica”.1 Così usiamo ‘2 x 2 = 4 ‘ per dedurre da ‘ ho due penny in ciascuna delle mie due tasche ‘a ‘ Io ho quattro penny in totale nelle mie tasche ‘ . ‘2 X 2 = 4 ‘ non è di per sé una vera proposizione a favore della quale può essere necessaria una prova induttiva, ma una tautologia che può essere vista come tautologica da chiunque possa comprenderne appieno il significato. Quando si procede ulteriormente nella matematica le proposizioni diventano così complicate che non possiamo riscontrare subito che sono tautologiche, e dobbiamo assicurarci di questo deducendole da più evidenti tautologie. Le proposizioni primitive su cui ripiegare alla fine, devono essere tali che nessuna prova andrebbe richiesta per esse , dal momento che sono evidenti tautologie come ‘ se p , allora p ‘.

1 Wittgenstein , op . cit . , 6.211. Nella vita, invero, non è mai la proposizione matematica a servirci: la proposizione matematica l’usiamo solo per concludere da proposizion, che non appartengono alla matematica, ad altre, che parimenti non appartengono ad essa. (Nella filosofia la domanda: «Ma per che scopo usiamo quella parola, quella proposizione?» conduce sempre a preziose intuizioni).  L. W. Tractatus Ed. Einaudi Paperbacks. Trad. Amedeo G. Conte.

Ma le tautologie di cui la matematica consiste possono forse risultare non essere del tipo di Wittgenstein, ma di qualche altro tipo. Il loro principale utilizzo è di facilitare l’inferenza logica; questo si ottiene nel modo più evidente con la costruzione di tautologie nel senso di Wittgenstein, perché se ‘ se p , allora q’ è una tautologia, possiamo logicamente dedurre ‘ q ‘da’ p ‘ , e viceversa, se ‘ q ‘ segue logicamente da ‘ p ‘, ‘ se p , allora q ‘ è un tautologia.1 Ma è possibile che ci siano altri tipi di formule che potrebbero essere utilizzate per facilitare l’inferenza; per esempio, quello che possiamo chiamare identità come ” a = b ‘, che significa che ‘ a ‘ , ‘ b ‘ possono essere sostituiti l’uno dall’altro in qualsiasi proposizione senza alterarla. Non voglio dire senza alterarne la verità o falsità, ma senza alterare quello che è la proposizione. ‘2 + 2 = 4 ‘ potrebbe benissimo essere una identità in questo senso, dal momento che ‘io ho 2 + 2 cappelli ‘e’ io ho 4 cappelli ‘ sono la stessa proposizione, in quanto sono d’accordo o in disaccordo con gli stessi insiemi di massima possibilità di verità.

1 Questo può forse essere reso più chiaro osservando che , se ‘ q ‘ segue logicamente da ‘ p’ , ‘p . ~q ‘ deve essere autocontraddittoria , quindi ‘ ~ ( p. ~ q) ‘ tautologica o ‘p ⊃ q ‘ tautologica.

Il nostro problema successivo è quello di decidere se la matematica consiste di tautologie ( nel significato preciso definito da Wittgenstein, a cui limiteremo in futuro la parola ‘ tautologia ‘ ) o di formule di qualche altro tipo. E’ abbastanza chiaro che la geometria, in cui noi consideriamo certi termini come ‘ punto ‘ , ‘ linea ‘ , con il significato di qualsiasi cosa che soddisfa determinati assiomi, in modo che gli unici termini costanti sono funzioni verità come ‘ o ‘ , ‘ alcuni ‘ , consistono di tautologie . E lo stesso sarebbe vero dell’analisi se consideriamo i numeri come qualsiasi cosa che soddisfa gli assiomi di Peano. Questo punto di vista sarebbe comunque certamente inadeguato, perché dal momento che i numeri da 100 in su nel soddisfare gli assiomi di Peano, non ci darebbero alcun modo di distinguere che ‘Questa equazione ha tre radici ‘ da ‘ Questa equazione ha centotre radici ‘ . Quindi i numeri devono essere definiti non come variabili ma come costanti, e la natura delle proposizioni dell’analisi diventa dubbia.

Credo che siano tautologie, ma la prova di questo dipende dal fornire un’analisi dettagliata di questo, e la confutazione di ogni altra teoria dipenderà dal trovare una difficoltà insuperabile nei dettagli della sua costruzione. In questo capitolo mi propongo di discutere la questione in modo generale, che dovrà inevitabilmente essere piuttosto vaga e insoddisfacente. Io dapprima cercherò di spiegare le grandi difficoltà che una teoria matematica come tautologie deve superare, e poi cercherò di spiegare perché il tipo alternativo di teoria suggerita da queste difficoltà sembra irrimediabilmente impraticabile. Quindi, nei seguenti capitoli tornerò alla teoria che la matematica consiste di tautologie, discuterò e in parte respingerò il metodo per superare le difficoltà dato nei Principia Mathematica, e costruirò un’alternativa e, a mio avviso, una soluzione soddisfacente.

Il nostro primo lavoro è, quindi, le difficoltà della teoria tautologica. Essi nascono da una caratteristica fondamentale di analisi moderna che dobbiamo ora sottolineare. Questa caratteristica può essere chiamato estensionalità, e le difficoltà possono essere spiegate come quelle che noi affrontiamo se cerchiamo di ridurre un calcolo estensionale ad un calcolo di funzioni verità. Qui, naturalmente , stiamo usando ‘ estensione’ nel suo senso logico , in cui l’ estensione di un predicato è una classe, quella di una relazione una classe di coppie ordinate; in modo che nel chiamare la matematica estensionale intendiamo che non si occupa di predicati, ma di classi, non con relazioni nel senso ordinario, ma di possibili correlazioni , o ” relazioni in estensione “, come le chiama Russell. Prendiamo come esempi di questo punto tre concetti matematici fondamentali – l’idea di un numero reale , l’idea di funzione ( di una variabile reale ), e l’idea di somiglianza di classi (nel senso di Cantor ) .

I numeri reali sono definiti come parte dei numeri razionali; qualsiasi parte di numeri razionali è un numero reale , e ci sono 2ℵ0 di questi. Non è necessario che la parte debba essere definita da qualche proprietà o predicato dei suoi membri in ogni ordinario significato di predicato. Un numero reale è dunque una estensione, e può anche essere un’estensione senza corrispondente intensione. Nello stesso modo una funzione di una variabile reale è una relazione in estensione, che non necessita di essere data da qualsiasi relazione reale o formula.

Il punto è forse più evidente nella definizione di Cantor di somiglianza. Due classi si dicono che sono simili (cioè hanno lo stesso numero cardinale ) quando esiste una relazione biunivoca il cui dominio è una classe e il dominio inverso quella dell’altra. Qui è essenziale che la relazione biunivoca deve essere solo una relazione in estensione; è ovvio che due classi possono essere simili, ossia possono essere correlate, senza che vi sia alcuna relazione effettivamente correlandole.

C’è una questione letterale che richiede una menzione qui; io non uso la parola ‘ classe ‘ per definire un principio di classificazione, come la parola suggerirebbe naturalmente, ma per ‘classe’ intendo qualsiasi insieme di oggetti dello stesso tipo logico. Tale insieme, mi pare, può o non può essere definibile mediante enumerazione o come l’estensione di un predicato. Se non è definibile così non possiamo non citarlo per sé stesso, ma solo occuparci di questo per implicazione in proposizioni su tutte le classi o su alcune classi. Lo stesso vale per le relazioni in estensione, per le quali non intendo solo le estensioni di effettive relazioni, ma intendo qualsiasi insieme di coppie ordinate. Che questa è la nozione che si verifica in matematica mi sembra assolutamente chiaro dall’ultimo degli esempi precedenti, la definizione di Cantor di similitudine, dove ovviamente non è necessario per la relazione biunivoca in estensione essere o finita o l’estensione di una effettiva relazione.

La matematica è quindi essenzialmente estensionale, e può essere chiamato un calcolo di estensioni, in quanto le sue proposizioni affermano relazioni tra estensioni. Questo, come abbiamo detto, è difficile ridurlo ad un calcolo di funzioni verità, a cui deve essere ridotto se la matematica è composta di tautologie; perché le tautologie sono funzioni verità di un certo tipo speciale, vale a dire quelle in accordo con tutte le possibilità di verità dei loro argomenti. Possiamo forse più facilmente spiegare la difficoltà con un esempio.

Prendiamo un’affermazione estensionale del tipo più semplice possibile: l’affermazione che una classe include un’altra. Finché le classi sono definite come le classi di cose aventi determinati predicati φ e ψ, non ci sono difficoltà. Che la classe di ψ comprenda la classe di φ significa semplicemente che tutto ciò che è φ è una ψ, che, come abbiamo visto sopra è una funzione verità. Ma abbiamo visto che la matematica ha (almeno apparentemente) a che fare anche con le classi che non sono date da predicati che le definiscono. (Tali classi non si presentano solo quando menzionate separatamente, ma anche in qualsiasi formula riguardante ‘ tutte le classi ‘, ‘ tutti i numeri reali “.) Prendiamo due di tali classi più semplici possibile – la classe ( a, b ​​, c) e la classe (a, b). Allora che la classe (a, b , c ) include la classe (a, b ) è, in senso lato, tautologico e, a parte la sua banalità sarebbe una proposizione matematica; ma non sembra essere una tautologia nel senso di Wittgenstein, cioè un certo tipo di funzione verità di proposizioni elementari. Il modo ovvio di cercare di renderla una funzione verità è quello di introdurre l’identità e scrivere ‘ (a, b ) è contenuta in (a, b , c ) ‘ come ‘ ( x ) : . x = a . v . x = b : ⊃: . x = a . v . x = b . v . x = c ‘ . Questo appare certamente come una funzione verità tautologica, i cui argomenti complessivi sono i valori di ‘ x = a ‘ , ‘ x = b ‘ , ‘ x = c ‘ , cioè proposizioni come ‘ a = a’, ‘ b = a ‘ , ‘ d = a ‘. Ma queste non sono per nulla proposizioni reali, in ‘ a = b ‘ o ‘a’ , ‘b’ sono nomi della stessa cosa, in questo caso la proposizione non direbbe nulla, o di cose diverse, nel qual caso è assurda. In nessuno dei due casi è l’affermazione di un fatto; ma sembra solo essere una vera affermazione per la confusione con il caso in cui ‘a’ o ‘ b ‘ non sono un nome, ma un descrizione.1 Quando ‘a’ , ‘ b ‘ sono entrambi nomi, l’unico significato che può essere assegnato a ‘ a = b ‘ è che esso indica che noi usiamo ‘a’ , ‘ b ‘, come i nomi della stessa cosa o, più in generale , come simboli equivalenti.

La precedente e altre considerazioni hanno portato Wittgenstein al punto di vista che la matematica non consiste di tautologie, ma di quello che lui chiamava ” equazioni “, per la quale preferirei sostituire ‘identità’. Vale a dire, le formule nella forma ‘ a ​​= b ‘ dove ‘ a’, ‘b’ sono simboli equivalenti. C’è una certa plausibilità in questo ragionamento, per esempio , di ‘2 + 2 = 4 ‘ . Poiché ho 2 + 2 cappelli ‘ , ‘ ho 4 cappelli ‘ sono la stessa proposizione, 2  mentre ‘2 + 2 ‘e ‘4’ sono simboli equivalenti. Così com’è posta questa è ovviamente una visione incredibilmente ristretta della matematica, e la limita alla semplice aritmetica; ma è interessante vedere se una teoria della matematica non poteva essere costruita attraverso le identità per la sua costituzione. Ho speso un sacco di tempo a sviluppare tale teoria, e ha scoperto che bisognava affrontare quella che mi sembrava una insuperabile difficoltà. Sarebbe fuori luogo qui dare una dettagliata indagine di questo vicolo cieco, ma cercherò di indicare in modo generale, le ostruzioni che bloccano la sua uscita.

Prima di tutto dobbiamo considerare di quale tipo saranno le preposizioni matematiche in una tale teoria. Supponiamo che il tipo più primitivo sia l’identita ‘ a = b ‘ , che diventa una vera e propria proposizione solo se viene assunto di essere non sugli oggetti che significano ‘ a’, ‘ b’, ma su questi simboli stessi; la matematica consiste quindi di proposizioni costruite su identità con un processo analogo a quello su cui sono costruite le proposizioni ordinarie di elementi atomici; vale a dire, le proposizioni matematiche sono (in questa teoria), in un certo senso, funzioni verità di identità. Forse questa è un’esagerazione, e la teoria potrebbe non asserire che tutte le proposizioni matematiche siano di questa forma, ma è chiaramente una delle forme importanti che supponiamo che si verifichino.

Così

‘ x2 – 3x + 2 = 0 : ⊃ x . x . = 2 . V x = 1 ‘

si direbbe che sia in questa forma, e corrisponderebbe a una proposizione verbale che era una funzione verità delle proposizioni verbali corrispondenti all’argomento ‘ x = 2 ‘ , ecc.

1 Per una analisi più completa delle identità vedere il prossimo capitolo .

2 Nel senso spiegato sopra. Essa non è chiaramente la stessa frase, ma è la stessa funzione verità di proposizioni atomiche e così affermano lo stesso fatto.

Così la proposizione di cui sopra sarebbe pari a ‘ Se ” x2 – 3x + 2 “significa 0 , ” x “significa 2 o 1 ‘ . La matematica sarebbe quindi, almeno in parte, l’attività di costruire formule che corrispondano in questo modo a proposizioni verbali. Tale teoria sarebbe difficile e forse impossibile da sviluppare nei dettagli, ma ci sono , credo , altre e più semplici ragioni per respingerla. Queste nascono non appena smettiamo di trattare la matematica come una struttura isolata, e prendiamo in  considerazione gli elementi matematici in proposizioni non matematiche. Per semplicità limitiamoci ai numeri cardinali, e noi stessi supponiamo di conoscere l’analisi della proposizione che la classe di φ è in numero n [ Schermata 2013-08-22 alle 18.42.59  (φx ) ∊ n ]. Qui φ può essere un qualsiasi predicato ordinario che definisce una classe, ad esempio, la classe di φ può essere la classe degli inglesi. Ora prendete una certa proposizione come ‘ Il quadrato del numero di φ è superiore di due rispetto al cubo del numero di ψ ‘. Questa  proposizione non  possiamo, credo , aiutarci ad analizzarla in questa sorta di modo:

( ∃ m , n ) .Schermata 2013-08-22 alle 18.42.59  ( φ x ) ∊ m .  Schermata 2013-08-22 alle 18.42.59 ( ψx ) ∊ n . m2 = n3 + 2 .

Si tratta di una proposizione empirica e non di una proposizione matematica, e riguarda φ e ψ, non i relativi simboli; perfino qui si presenta in questa la pseudo preposizione matematica m2 = n3 + 2 , a cui, secondo la teoria in discussione, si può attribuire solo senso assumendo che sia una relazione tra simboli, in tal modo rendendo l’ intera proposizione di essere in parte riguardante simboli. Inoltre, essendo una proposizione empirica, è una funzione verità di proposizioni elementari che esprimono accordo con quelle possibilità che danno i numeri di φ di e di ψ che soddisfano m2 = n3 + 2 . Così ‘ m2 = n3 + 2′ non è , come sembra essere , uno degli argomenti veri nella proposizione di cui sopra, ma piuttosto una parte della funzione verità come ‘ ~ ‘ o ‘ v ‘ o ‘∃, m . n , ‘ che determina quale funzione verità di proposizioni elementari è quella che stiamo affermando. La teoria dell’identità della matematica è del tutto inadeguata a spiegare un tale uso di m2 = n3 + 2.

D’altra parte, la teoria tautologia farebbe tutto ciò che viene richiesto, e secondo questa m2 = n3 + 2 sarebbe una tautologia per i valori di m ed n che la soddisfano, e una contraddizione per tutti gli   altri. Così

Schermata 2013-08-22 alle 18.42.59    ( φx ) ∊ m .  Schermata 2013-08-22 alle 18.42.59   ( ψx ) ∊ n . m2 = n3 + 2

sarebbe per il primo gruppo di valori di m , n equivalente semplicemente a

Schermata 2013-08-22 alle 18.42.59   ( φx ) ∊ m .   Schermata 2013-08-22 alle 18.42.59   ( ψx ) ∊ n,

semplicemente,  ‘ m2 = n3 + 2 ‘ essendo tautologica, e quindi superflua, e   per tutti gli altri valori sarebbe autocontraddittoria . Così che

‘ ( ∃ m , n ) .  Schermata 2013-08-22 alle 18.42.59   ( φ x ) ∊ m .  Schermata 2013-08-22 alle 18.42.59    ( ψx ) ∊ n . m2 = n3 + 2 ‘

sarebbe la somma logica delle proposizioni

‘ Schermata 2013-08-22 alle 18.42.59     (  φx ) ∊m . Schermata 2013-08-22 alle 18.42.59  ( ψx ) ∊n ‘

per ogni m , n che soddisfano m2 = n3 + 2 , e contraddizione per tutti gli altri m , n; ed è quindi la proposizione richiesta, dal momento che in una somma logica le contraddizioni sono superflue. Quindi questa difficoltà, che sembra fatale per la teoria dell’identità, è sfuggita del tutto dalla teoria tautologica, per cui noi quindi siamo incoraggiati a proseguire e vedere se non possiamo trovare un modo per superare le difficoltà che abbiamo trovato confrontandoci con il tentativo di ridurre il calcolo estensionale ad un calcolo di funzioni verità. Tale soluzione viene tentata in Principia Mathematica, e verrà discussa nel prossimo capitolo; ma prima di procedere a questo si deve dire qualcosa sulle ben note contraddizioni della teoria degli aggregati da cui anche la nostra teoria dovrà rifuggire .

Non è sufficientemente osservato, e la questione è del tutto trascurata in Principia Mathematica, che queste contraddizioni ricadono fondamentalmente in due gruppi distinti, che chiameremo A e B. Quelli più conosciuti sono così suddivisi: –

A. ( 1 ) La classe di tutte le classi che non sono membri di se stesse.

( 2 ) La relazione tra due relazioni quando una non ha sé stessa nell’altra.

( 3 ) La contraddizione di Burali Forti del più grande ordinale .

B.      ( 4 ) ‘ sto mentendo . ‘

( 5 ) Il minimo intero non nominabile in meno che diciannove sillabe .

( 6 ) Il più piccolo ordinale indefinibile .

( 7 ) La contraddizione di Richard.

( 8 ) La contraddizione di Weyl circa ‘ eterologo ‘ 1

Il principio secondo il quale li ho divisi è di fondamentale importanza. Il gruppo A si compone di contraddizioni che, ove non vengano presi accorgimenti contro di esse, si verificherebbero in uno stesso sistema logico o nello stesso sistema matematico. Esse coinvolgono solo termini logici o matematici come classe e numero, e mostrano che ci deve essere qualcosa di sbagliato con la nostra logica o la nostra matematica. Ma le contraddizioni del gruppo B non sono puramente logiche, e non possono essere espresse solo in termini logici; perché tutte contengono qualche riferimento al pensiero, al  linguaggio, o al simbolismo, che non sono termini formali ma empirici.

1 Per i primi sette di questi vedasi Principia Mathematica, 1 (1910) , p . 63 . Per l’ottavo vedere Weyl, Das Kontinuum, p. 2.

Così esse possono essere dovute non a un difetto di logica o di matematica, ma ad idee errate in materia di pensiero e di linguaggio. Se è così, non sarebbero rilevanti per la matematica o la logica, se per ‘ logica ‘ si intende un sistema simbolico, anche se naturalmente sarebbero rilevanti per la logica nel senso dell’analisi del pensiero. 1 Questa punto di vista del secondo gruppo di contraddizioni non è originale. Ad esempio, Peano ha deciso che ” Exemplo de Richard non pertine ad Mathematica , sed ad linguistica “, 2 e dunque li ha respinti. Ma tale atteggiamento non è del tutto soddisfacente. Abbiamo contraddizioni che coinvolgono entrambe le idee matematiche e linguistiche; il matematico le respinge dicendo che l’errore deve trovarsi negli elementi linguistici, ma il linguista potrebbe altrettanto bene respingerle per il motivo opposto, e le contraddizioni non saranno mai risolte. L’unica soluzione che sia mai stata data, 3 quella dei Principia Mathematica, sicuramente attribuisce le contraddizioni a cattiva logica, e spetta agli avversari di questo punto di vista mostrare chiaramente l’errore in quello che Peano chiama linguistico, ma che io preferirei chiamare chiamare epistemologico, a cui queste contraddizioni sono dovute.

1 Questi due significati di ‘logica ‘ sono spesso confusi. In realtà dovrebbe essere chiaro che chi dice che la matematica è logica non intendendo per ‘logica ‘ affatto la stessa cosa di quelli che definiscono la logica come l’analisi e la critica del pensiero.

2 Rivista di Mat., 8 (1906), p. 157 .

3 Altre cosiddette soluzioni sono solo inadeguate scuse per non dare una soluzione.

Seguirà il cap II.

RULE OF SUCCESSION

19 Dic

messaggio_d_errorePropongo la traduzione di un  breve appunto di Frank Ramsey sul calcolo analitico delle probabilità. La nota è stata pubblicata dalla prof.ssa Maria Carla Galavotti in Notes on Philosophy, Probability and Mathematics ed. Bibliopolis. Al termine riporto il testo in lingua originale.

REGOLE DI SUCCESSIONE

Siano n oggetti che sono A quale è la probabilità che l’n+1esimo oggetto sia A.

Supponiamo la probabilità a priori di μ su n+1 di essere A sia φ (μ).

Tutte le permutazioni siano equiprobabili

La probabilità richiesta è

Schermata 2013-12-03 alle 21.38.53

Schermata 2013-12-03 alle 21.39.21

traduzione Schermata 2013-12-03 alle 21.39.35

2 Ciò deriva da: la probabilità di n oggetti (su n) di essere A è pari alla probabilità di n + 1 oggetti su n + 1 di essere  A, più la probabilità di n oggetti su n +1 di essere A 

Se la probabilità a priori di ciascuno di essere A è p 3

Schermata 2013-12-03 alle 21.39.47

3 n+1Cμ è la notazione di Ramsey per i coefficienti binomiali  Schermata 2013-12-03 alle 21.38.28

La probabilità richiesta è =

Schermata 2013-12-03 alle 21.45.06

verifica indipendente dai precedenti fatti.

Metodo alternativo

Supponiamo di scegliere n oggetti da un insieme infinito (o molto grande)

Supponiamo che φ (x) dx sia la probabilità a priori che una frazione x, x+dx di questa sia A

Schermata 2013-12-03 alle 21.45.26

La probabilità richiesta  =

Schermata 2013-12-03 alle 21.45.39

 Se φ (x) è costante  (=1) = 

Schermata 2013-12-03 alle 21.45.55

Se la probabilità di ciascuno di essere A è p φ (x) è infinita quando x=p , 0 altrove.

Risultato = p

In generale se φ(x) è continua con derivate continue di qualsiasi ordine eccetto ad un numero finito di punti

Schermata 2013-12-03 alle 21.46.03

Traduzione Schermata 2013-12-03 alle 21.54.10

Similmente se qualche derivata di φ(x) ≠ 0 in 1

Schermata 2013-12-03 alle 21.54.21

Questo è il testo in lingua originale:

RULE OF SUCCESSION

n things are A what is chance of n + 1th being A.

Suppose chance a priori of it μ of n+1 being A is φ (μ).

all permutations equally probable.

required chance is 2

Schermata 2013-12-03 alle 21.38.53

Schermata 2013-12-03 alle 21.39.21

Schermata 2013-12-03 alle 21.39.35

2 This follows from: the probability of n things (out of n) being A equals the probability of n + 1 things out of n + 1 being A plus the probability of n  things out n+1 being A

If a priori probability of each being A is p 3

Schermata 2013-12-03 alle 21.39.47

3n+1Cμ is Ramsey’s notation for the binomial coefficient  Schermata 2013-12-03 alle 21.38.28

required chance =

Schermata 2013-12-03 alle 21.45.06

verifies independent of previous happenings.

Alternative method

Suppose n things are chosen from infinite (or very large) set.

Suppose φ (x) dx is chance a priori that a proportion x, x + dx of these are A.

Schermata 2013-12-03 alle 21.45.26

Chance required =

Schermata 2013-12-03 alle 21.45.39  

if φx is const (= 1) =

Schermata 2013-12-03 alle 21.45.55

If chance of each being A is p φ (x) is infinite when x = p, 0 elsewhere.

Answer = p.

In general if φ(x) is continuous with continuous derivatives of all orders save at finite no of points

Schermata 2013-12-03 alle 21.46.03

Schermata 2013-12-03 alle 21.54.21 Schermata 2013-12-03 alle 22.41.35

Similarly if any of derivatives of φ (x) ≠ 0 at 1

Schermata 2013-12-03 alle 21.54.21

THE MEANING OF HYPOTHETICAL PROPOSITIONS

9 Dic

Berlusconi trova la soluzione alla mancanza di fondi per ridurre le tasseRiporto la traduzione di una nota di Frank Ramsey sulle proposizioni ipotetiche che offre lo spunto ad osservare come talvolta l’uso di questo tipo di frasi possa indurre in errore anche persone abituate all’uso della logica matematica. L’uso di queste proposizioni è spesso  un mezzo per indurre in errore le persone che utilizzano mezzi di comunicazione allo scopo di far fare loro cose che non sarebbero orientate a fare.

Il brano è tratto dal libro di Frank Ramsey Notes On Philosophy, Probability ad Mathemamatics a cura della prof.ssa Maria Carla Galavotti, edizione Bibliopolis. Al termine riporto il testo in lingua originale.

IL SIGNIFICATO DELLE PROPOSIZIONI IPOTETICHE

Marzo 1928

1 . ” Se p allora q” spesso significa solo p ⊃ q , ma ci sono casi in cui questo non può essere il suo significato, vale a dire quelli in cui chi pensa o è sicuro che p è falso o sicuro che q è vero, o, se è non sta facendo un’asserzione a proprio vantaggio, ma per quello di un pubblico, nel caso in cui egli pensa che il pubblico sia certo di una di queste cose. Siamo spinti, quindi, a cercare altri significati di ” se p allora q “, che possono, ovviamente, ricavarsi anche in altri casi.

2 . Un certo significato è che q segue logicamente da p, ma questo ovviamente non copre tutti i casi.

3 . Al fine di trovare quello che deve essere in ogni caso uno dei significati più comuni , prendiamo i casi in cui p è noto per essere falso, ci sono tre casi secondo cui come q è noto per essere falso, noto per essere vero o dubbio.

Così abbiamo

( a) se avesse piovuto, egli non sarebbe venuto

( b) se avesse piovuto, sarebbe venuto lo stesso

( c) se piovesse, lui non sarebbe venuto (ma questo se fosse non lo so) .

4 . Si potrebbe pensare che ciò che si intendeva era semplicemente che p ⊃ q è un esempio di una proposizione vera generale φ x ⊃x ψ x .

Questo non è, tuttavia, evidentemente, insufficiente, ” tutti qui hanno votato conservatore” non giustifica “se Jones fosse stato qui avrebbe votato conservatore”.

5 . Potremmo quindi pensare che ciò che si intendeva era che p ⊃ q è un esempio di una regola, ma questo è chiaramente troppo. “Se fosse piovuto, non sarebbe venuto” non implica che egli non viene mai quando piove.

6 . E’ chiaro, però, che ci occupiamo del un caso di una regola, ma che questo caso non è in generale p ⊃ q ma nella forma pr ⊃ q, in modo che “se p allora q “significa che (∃ r) : pr ⊃ q è un caso di una regola, e quindi qualcosa di più riguardo a r. (Per regola si intende anche la tautologia).

7 . Circa r richiediamo che almeno questo dovrebbe essere vero, che dovrebbe essere compatibile con p, nel senso che  Schermata 2013-11-28 alle 10.08.58      non è un’istanza di qualsiasi regola.

8 . Ma questo non è sufficiente, o prendendo r = p ⊃ q poniamo “se p allora q” qualcosa di vero ogniqualvolta p è falsa e p , q compatibili. Un ulteriore requisito che poniamo è che r dovrebbe essere (a livello dell’analisi in questione) una congiunzione di proposizioni assolutamente specifiche, cioè che non contengono “o” , “se” , o “qualche” (e se accettiamo il risolutivo di no, “non”). La ragione di questo è che se r è una disgiunzione , l’alternativa che è vera non può essere una delle alternative compatibili con p un caso che deve essere chiaramente escluso, e può sussistere per la precedente riserva senza escludere comunque qualche caso valido dal momento che se r1 r2 V ⋅ p : ⊃ : q è un caso di una regola così lo è

r1 ⋅ p : ⊃ : q.

Oltre a questo r spesso deve essere di un tipo implicato dal contesto, e quasi sempre deve riguardare gli eventi non successivi rispetto a quelli con cui q è interessato 1. p generalmente fa anche questo, ma non sempre, ad esempio “Se avesse piovuto (stando  per piovere!) alle 3, il cielo non sarebbe stata limpido alle 2.30”.

1 Nota in tutto questo si presume che p non è impossibile cioè contrario a una regola, se si può dire che essa implica ciò che vogliamo.

10 . Consideriamo ora la plausibilità di una tale interpretazione dei casi ( a) , ( b) , ( c ) di cui sopra.

Nel caso (a ) nessuna ulteriore limitazione su r è necessaria, (oltre che sia compatibile con p e assolutamente specifico o categorico) ma nei casi ( b ) e ( c ) si deve in qualche modo evitare il nostro porre r che esista ad esempio la sua presenza qui oggi, che non è chiaramente presunta.

r deve evidentemente essere riferito agli avvenimenti precedenti alla sua reale o possibile enunciazione.

11 . Salvo che r sia abbastanza sicuramente limitato anche oltre questa restrizione temporale, è possibile perché se p, allora q allora se p, allora q sono entrambi veri . Quindi supponiamo che p = non c’era una riunione, q = io sono andato a fare una passeggiata.

Potremmo prendere r = r1 ⋅  r2  ponendo se p , allora q

o r = r1 ⋅ r3  ponendo  se p , allora Schermata 2013-08-23 alle 22.32.01

dove r1 = io sono in salute in esercizio energico, ecc

r2 = il segretario opera con accuratezza (un po’ più di analisi è necessaria per renderlo specifico)

r3 = Ho ricevuto un avviso di una riunione.

( Aggiunta in margine 🙂 questo dimentica che la “legge ” non deve ammettere eccezioni.

12 . Questa analisi sembra coprire i casi ordinari in cui p è conosciuto per essere falso; come fa quando q è noto per essere vero. Quando p è noto per essere falso abbiamo ( b ) di cui sopra nuovamente

Quando p è dubbio abbiamo

( d ) (“Lui non è venuto”) “Non necessariamente, perché avrebbe dovuto comunque (= se fosse venuto ) essere già 6 andato via” che la nostra analisi copre molto bene; ma quando p è noto per essere vero non ci sembra di ottenere del tutto casi del genere.

6 Questo mette in evidenza che in questo senso ” se p allora q ” e ” se  Schermata 2013-08-23 alle 22.32.01     allora  Schermata 2013-11-24 alle 21.04.13    ” non sono la stessa cosa. Non potremmo dire invece nel caso ( d ) “se fosse ancora qui, non sarebbe venuto”.

13 . La ragione di questo è che quando p e q sono entrambi noti per essere veri, noi non diciamo ” se p , allora q” , ma ” perché p , q” : dove ” perché p , q ” significa p ⋅ q ⋅ se p, allora q (nel senso spiegato sopra). Ma non abbiamo praticamente mai usato questa frase in questo senso quando p è sugli eventi successivi a q.

14 . Resta, tuttavia, almeno un altro tipo di proposizione ipotetica, che non afferma una implicazione né materiale, né logicacausale, come potremmo chiamare i tre tipi finora considerati; perché ci sono casi in cui essa ha ciò che può essere chiamato un senso epistemico, e significa che q era o avrebbe potuto essere o avrebbe dovuto essere dedotto da p o da una determinata persona in una determinata occasione o da qualsiasi persona di un certo tipo in qualsiasi occasione di un certo tipo.

Le istanze di questo sono: “se avesse avuto un neo sul polso, lui sarebbe stato l’assassino”, ” il suo avere un neo implicava che lui era l’assassino”, “perché aveva un neo, lui era l’assassino”.

15 . Se il senso è epistemico, la proposizione afferma che q sia stata o sarebbe o potrebbe essere stata validamente dedotta da p, cioè che p ⊃ q era noto o virtualmente conosciuto attraverso un procedimento che non contiene alcun procedimento attraverso cui p era o non era conosciuto o conosciuto virtualmente. Per essere virtualmente conosciuto significava che era una conseguenza logica di oggetti conosciuti insieme a  certe proposizioni generali come poter esprimere le nostre corrette abitudini nel fare inferenze, e un procedimento di conoscenza virtuale rappresenta un qualsiasi insieme di oggetti conosciuti e di quel genere di proposizioni generali.

Esso non può asserire tanto come questo, ma soltanto che p ⊃ q potrebbe essere stato conosciuto o virtualmente conosciuto ecc.; qui potrebbe non essere assolutamente vago; nulla potrebbe essere conosciuto ecc. dal soggetto essendo detto (e non di più); ciò che si intende è che se certe osservazioni fossero state assunte o no, o se il soggetto avesse conosciuto certi oggetti che tutti ci si potrebbe aspettare di conoscere, avrebbe conosciuto virtualmente che p ⊃ q .

I ” se” in questa ultima frase andrebbero considerati con attenzione. Il primo è causale, il secondo è un tipo comune che potremmo chiamare spurio. 12 Sembra a prima vista come se fosse causale a causa della condizione insoddisfatta, ma in realtà dice “se avesse saputo r, avrebbe saputo qualcosa da cui deriva p ⊃ q”. Ora questo non è esattamente espresso, non significa per esempio che avrebbe potuto solo conoscere r per essere così bravo che avrebbe certamente conosciuto qualcosa altro per cui segue p ⊃ q; significa semplicemente che p ⊃ q segue da r (insieme con quello che lui sapeva); cioè non sussiste davvero elemento ipotetico in esso. Quindi, anche “se qualcuno dice p dice il vero” significa semplicemente p.

12 In precedenza: il materiale spurio.

17 . Il  dire il “p ⊃ q ” potrebbe essere stato conosciuto, è, se le condizioni implicite sono opportunamente scelte, molto simile a dire ” se p allora q “, dove il se è causale. Questo punto può essere importante in relazione alla successiva discussione delle leggi della natura, che possono rivelarsi essere generalizzazioni, come in un certo senso potrebbero essere (o anche sono) note.

18 . Questo “potrebbe essere” è possibile nel senso dell’ipoteticamente necessario di Bradley; ma, come mostra Johnson su 13 questo argomento non può essere il senso ultimo possibile che è ” non contrario a qualche regola”; per p è possibile solo nel senso di Bradley quando ∃ r . r ⊃ p è un caso di una regola, e r ⋅ p è possibile nel senso fondamentale.

13 Cfr. W.E. Johnson, Logic , parte III , cit. , Cap. I; F.H. Bradley, The Principles of Logic, cit., cap. VII .

19 . Johnson cade in un pasticcio per non avere una corretta teoria delle descrizioni; quando ( x ) . φ x ⊃ ψ x è una legge lui non dice “se qualcosa fosse φ sarebbe ψ”, ma si limita agli oggetti che potrebbero essere φ. Questo è sbagliato perché per gli oggetti a tali per cui φ a è in contrasto con una regola la nostra affermazione è ancora vera. Anche ciò che egli intende è che non possiamo dire se ( ꙇ x )  (χ x ) fosse φ sarebbe ψ, che non si afferma affatto, e se ciò anche fosse sarebbe ancora vero.

Inoltre è un errore supporre che in tal caso il campo di applicazione ( ꙇ x ) ( χ x ) deve essere il minimo possibile; esso potrebbe essere l’intera proposizione come ad esempio “Se il re non fosse il re egli non avrebbe avuto nessuna di importanza”.

20 . Nota sul ” tale che se ” .

In generale a si dice essere tale che p

se ( ∃ φ ) : φ assolutamente specifico e limitato a ? proprietà non relazionali (? relazioni tra loro delle parti di a consentite ma non relazioni con oggetti esterni) ⋅ φ a ⋅ φ a ⊃ p è un esempio di una regola.

Se p è nella forma r ⊃ s forse la compatibilità di un φ a, r è anche asserita. Forse anche alcune proprietà extra relazionali di a e proposizioni sarebbero ammesse in φ, ma ovviamente non tutte.

“La realtà è tale che tutti gli uomini sono mortali ” (Bradley), significa che ci sono fatti atomici che implicano (come esempio di una legge, vale a dire una tautologia) che tutti gli uomini sono mortali  C’è quindi qualcosa nel dire che ha un fondamento categorico, ma difficilmente nel modo in cui pensa.

Mill, Johnson e Cook Wilson 16, tutti danno spiegazioni circolari di questo. Mill dice che significa possibilità di inferire ( cioè se … ) (vedi Bradley 17), Johnson apparentemente afferma la stessa cosa, ma può davvero significare un se spurio; Cook Wilson dice che ciò asserisce la dipendenza della soluzione di un problema da quella di un altro, vale a dire che se abbiamo risolto l’uno potremmo risolvere l’altro.

16 Cfr. J.S. Mill, A System of Logic , 1a ed. 1843 ; W.E. Johnson, Logic , parte I, cit.; J.Cook Wilson , Statement and Inference, 2 vol., Oxford: Clarendon Press, 1926 (postumo).

17 Vedi nota 13 . Vedi anche F.H. Bradley, Essay on Truth and Reality, Oxford: Clarendon Press, 1914.

22 . La lingua ha modi sottili per distinguere i diversi sensi di “se”; prendiamo ad esempio

Qui tutti hanno votato per costui

Quindi, se lui era lì, deve aver votato per costui (proposizione solo materiale)

Ma se lui fosse stato lì, avrebbe votato contro (proposizione materiale e anche causale)

∴ lui non era lì.

23 . Perché siamo interessati alle conseguenze di condizioni insoddisfatte;

( a) è una forma di finzione di particolare interesse perché vicina alla realtà

( b) è un modo di affermare regole

( c) è un modo di distribuire lode e biasimo .

E questo è il testo in lingua originale:

THE MEANING OF HYPOTHETICAL PROPOSITIONS

March 1928

1. “if p then q” often means just p ⊃ 4; but there are cases in which this cannot be its meaning, namely those in which the thinker is either sure that p is false or sure that q is true, or, if he is asserting not for his own benefit but for that of an audience, the cases in which he thinks the audience is sure of either of these things. We are driven, therefore, to look for other meanings of “if p, then q” which may, of course, obtain in other cases also.

2. One such meaning is that q follows logically from p, but this obviously does not cover all the cases.

3. In order to find what must be at any rate one of the commonest meanings, let us take the cases in which p is known to be false; there are three such cases according as q is known to be false, known to be true or doubtful.

Thus we have

(a) if it had rained, he wouldn’t have come

(b) if it had rained, he would have come all the same

(c) if it were raining, he wouldn’t come (but as it is I don’t know).

4. It might be thought that what was meant was simply that p ⊃ q is an instance of a true general proposition φ x ⊃x ψ x.

This is, however, clearly not enough; “everyone there voted conservative” does not justify “if Jones had been there he would have voted conservative”.

5. We might next think that what was meant was that p ⊃ q is an instance of a law; but this is clearly too much. “If it had rained, he wouldn’t have come” does not imply that he never comes in the rain.

6. It is clear, however, that we are concerned with an instance of a law, but that this instance is not in general p ⊃q but of the form pr ⊃ q, so that “if p then q” means that (∃ r): pr⊃ q is an instance of a law, and then something further about r. (Law taken to include tautology).

7. About r we require at least that it should be true, and that it should be compatible with p, in the sense that   Schermata 2013-11-28 alle 10.08.58          is not an instance of any law.

8. But this is not enough, or by taking r = p ⊃ q we shall make “if p then q” something true whenever p is false and p, q compatible. A further requirement we make is that r should be (at the level of analysis in question) a conjunction of absolutely specific propositions, i.e. contain no “or”, “if”, or “some” (and if we accept the determinable no, “not”). The reason for this is that if r is a disjunction, the alternative which is true may not be one of the alternatives compatible with p, a case which must clearly be excluded, and can be by the above proviso without excluding any valid case since if r1 V r2 ⋅ p : ⊃ : q is an instance of a law so is

r1⋅ p: ⊃ : q.

  1. Besides this r must often be of a kind implied by the context, and nearly always must concern events not later than those with which q is concerned 1. p will generally do this too, but not always; e.g. “if it had rained (been going to rain!) at 3, the sky would not have been bright at 2.30”.

1 Note in all this it is assumed that p is not impossible i.e. contrary to a law, if it is we can say that it implies what we like.

10. Let us now consider the plausibility of such an interpretation of the cases (a), (b), (c) above.

In case (a) no further limitation on r is necessary, (beyond its being compatible with p and absolutely specific or categorical) but in cases (b) and (c) we must somehow prevent our taking r to be e.g. his presence here now, which is clearly not intended.

r must evidently be about the events previous to his actual or possible setting out.

11. Unless r is fairly definitely limited beyond even this temporal restriction, it is possible for if p, then q and if p, then q both to be true. Thus suppose p = there was no meeting, q = I went for a walk.

We might take r = r1 ⋅ r2                                   giving if p then q

or r = r1 ⋅ r3                                                       giving if p then  Schermata 2013-08-23 alle 22.32.01

where r1 = I am in health live exercise etc.

r2 = the secretary is careful (a little more analysis is needed to make specific)

r3 = I received a notice of a meeting.

(Added in margin:) this forgets that “law” must admit no exception.

12. This analysis seems to cover the ordinary cases in which p is known to be false; how does it do when q is known to be true. When p is known to be false we have (b) above again.

When p is doubtful we have

(d) (“He’s not come”) “Not necessarily, because he would anyhow (= if he came) have gone away by now” 6 which our analysis covers very well; but when p is known to be true we seem to get no cases of the sort at all.

6 This brings out that in this meaning “if p then q” and “if Schermata 2013-08-23 alle 22.32.01     then Schermata 2013-11-24 alle 21.04.13     ” are not the same. We could not say instead of (d) “if he were still here, he wouldn’t have come”.

13. The reason for this is that when p and q are both known to be true we say not “if p then q”, but “because p, q”: where “because p, q” means p ⋅ q ⋅ if p, then q (in sense explained above). But we practically never use this phrase in ‘this sense when p is about later events than q.

14. There remains, however, al least one more kind of hypothetical proposition, which does not assert either a material, a logical or a causal implication, as we may call the three kinds hitherto considered; for there are cases in which it has what may be called an epistemic sense, and means that q was or might have been or ought to have been inferred from p either by a given person on a given occasion or by any person of a certain sort on any occasion of a certain sort.

Instances of this are; “if he had had a mole on his wrist, he would have been the murderer”; “his having a mole implied that he was the murderer”, “because he had a mole, he was the murderer”.

15. If the sense is epistemic, the proposition asserts that q either was would or might have been validly inferred from p, i.e. that p ⊃ q was either known or virtually known by a process not containing any process by which p was or was not known or virtually known. By being virtually known is meant being a logical consequence of things known together with such general propositions as would express our correct habits of inference, and a process of virtual knowing means any set of things known and of such general propositions.

It may not assert so much as this but only that p ⊃ q might have been known or virtually known etc.; here might is not absolutely vague; anything might be known etc. by the subject being told it (and no more); what is meant is that if certain observations had been taken or what not, or if the subject had known certain things everyone might be expected to know, he would have virtually known p ⊃ q.

  1. The “ifs” in this last sentence should be carefully considered. The first is causal, the second is a common type which we may call spurious. 12 It looks at first sight as if it were causal owing to the unfulfilled condition, but really it says “if he had known r, he would have known something from which p ⊃ q follows”. Now this is inexactly expressed, it does not mean e.g. that he could only have known r by being so clever that he would have certainly known something else from which p ⊃ q follows; it means simply that p ⊃ q follows from r (together with what he did know); i.e. there is really no hypothetical element in it. So also “if anyone says p he says truly ” means just p.

12 Formerly: the spurious material.

17. To say the “p ⊃ q” might have been known, is, if the implied conditions are suitably chosen, very much the same as to say “if p then q” where the if is causal. This point may be important in connection with the subsequent discussion of the laws of nature, which may turn out to be such generalisations as in some sense might be (or even are) known.

  1. This “might be” is the possible in Bradley’s sense of the hypothetically necessary; but as Johnson points out 13 this cannot be the ultimate sense of possible which is “not contrary to any law”; for p is only possible in Bradley’s sense when ∃ r . r ⊃ p is an instance of a law, cmd r ⋅ p is possible in the ultimate sense.

13 See W.E. Johnson, Logic, Part III, cit., Ch. I; F. H. Bradley, The Principle: of Logic, cit., Ch. VII.

19. Johnson falls into a muddle through having no correct theory of descriptions; when (x). φ x ⊃ ψ x is a law he will not say “if anything were φ it would be ψ” but restricts it to things which might be φ. This is wrong because for things a such that φ a is contrary to a law our assertion is still true. Also what he means is that we cannot say if (ꙇ x)()( x) were φ it would be ψ, which is not asserted at all, and if it were would still be true.

Also it is a mistake to suppose that in such a case the scope of (ꙇx)(χ x) need be the minimum possible; it may be the whole proposition e.g. “if the king were not king he would be noone of importance”.

20. Note on “such that if”.

In general a is said to be such that p

if (∃ φ): φ absolutely specific and limited to ? non-relational properties (?relations to one another of parts of a allowed but not relations to outside things) ⋅ φ a – φ a ⊃ p is instance of law.

If p is of form r ⊃ s perhaps compatibility of φ a, r also asserted. Perhaps also some extra relational properties of a and constant propositions allowed into φ but obviously not all.

“Reality is such that all men are mortal” (Bradley) means there are atomic facts which imply (as instance of a law, to-wit a tautology) that all men are mortal. There is therefore something in saying it has a categorical ground, but hardly in the way he thought.

  1. Mill, Johnson and Cook Wilson 16 all give circular explanations of it. Mill says it means inferribility (i.e. if…) (see Bradley 17); Johnson apparently the same but he may really mean a spurious if; Cook Wilson says it asserts the dependence of the solution of one problem on that of another, i.e. that if we solved one we could solve the other.

16 See J.S. Mill, A System of Logic, 1st ed. 1843; W.E. Johnson, Logic, Part I, cit.; J.Cook Wilson, Statement and Inference, 2 voll., Oxford: Clarendon Press, 1926 (posthumous).

17 See note 13. See also F.H. Bradley, Essay: on Truth and Reality, Oxford: Clarendon Press, 1914.

22. Language has subtle ways of distinguishing the different senses of “if”; consider for instance

Everyone there voted for it

So if he was there, he must have voted for it (material only)

But if he was there, he would have voted against it (material also causal)

∴ he was not there.

23. Why are we interested in the consequences of unfulfilled conditions;

(a) it is a form of fiction of peculiar interest because near to reality

(b) it is a way of stating laws

(C) it is a way of apportioning praise and blame.

PROPOSITIONAL FUNCTIONS AND PROPOSITIONS ARE BOTH SYMBOLS

30 Set

Come si suonano gli elettoriPropongo la traduzione di un appunto di Frank Ramsey riguardante la logica proposizionale pubblicato in lingua originale dalla prof.ssa Maria Carla Galavotti in Notes on philosophy, probability and mathematics ed. Bibliopolis. Al termine riporto il testo in inglese.

Occorre osservare come venga modificato il concetto di aggettivo e di particolare rispetto alla logica tradizionale (cfr. Lewis Carroll).

FUNZIONI PROPOSIZIONALI E PROPOSIZIONI SONO ENTRAMBE SIMBOLI

Funzioni propositive e proposizioni sono entrambi i simboli.

Russell si è messo in un pasticcio trattando funzioni come simboli, ma le proposizioni non come simboli, (lui li chiama “oggetti” ) p.41 ma non p. 48 (1).

1 Cfr. B. Russell e A.N. Whitehead, Principia Mathematica, Cambridge: Cambridge University Press. Vol. I, Prima edizione 1910.

La parola “funzione ” è davvero fuorviante. Non dobbiamo collegare le funzioni proposizionali e quelle matematiche; per loro l’unica cosa comune è una certa incompletezza che ci porta a simboleggiarle con l’aggiunta di un simbolo illustrativo del tipo che le completerebbe.

Le argomentazioni di Johnson che funzioni propositive e matematiche sono dello stesso tipo sono del tutto superficiali. Egli assimila una formulazione epistemica a una proposizione ad esempio ” φ a è dubbia ” a ” 4 = 2 + 2 ” senza provare a fornire un’analisi soddisfacente di entrambe.

L’ idea fondamentale alla base del concetto di una funzione proposizionale è quella di un’espressione, convenientemente rappresentata da un simbolo di funzione, poiché deve essere completata per fornire una proposizione ed è utile indicare come.

Potremmo dire che la caratteristica essenziale di una funzione è l’incompletezza, non l’ambiguità come dice Russell, che deriva solo da come deve essere completata.

Dal momento che i nomi di particolari devono essere completati per formare una proposizione, la questione si pone perché non li scriviamo anche come simboli di funzione. Vedremo che questo particolare trattamento dei particolari ha una reale giustificazione; questo, tuttavia, non deriva da una differenza reale tra particolari e universali, ma da una limitazione del linguaggio umano .

Un’Espressione (non una proposizione o una operazione ) serve come segno comune di un insieme di proposizioni, di cui vogliamo considerare una qualche funzione di verità, come, ad esempio, che tutte sono vere. L’insieme è l’insieme di proposizioni ottenute completando l’espressione in modo che abbia significato; ma poiché vi è più di un modo possibile di completarle, possiamo ottenere più di un solo insieme.

Così “saggio” ci dà l’insieme delle proposizioni della forma “x è saggio” , e anche il più ampio insieme di tutte le proposizioni, indipendentemente dalla sua forma, che contiene la parola ” saggio “, tra cui ad esempio ” Se Platone dice il vero, Socrate è saggio “. Noi non usiamo “saggio”, ma ” x è saggio ” per indicare il modo in cui completiamo l’espressione al fine di ottenere il set più ristretto di proposizioni, che noi spesso abbiamo occasione di usare ad esempio nel dire ” Alcuni uomini sono saggi “.

Distinguiamo questo insieme più ristretto, come valori di

Schermata 2013-09-30 alle 10.07.04

dal più ampio insieme di valori di

Schermata 2013-09-30 alle 10.09.28

e una distinzione simile è ovviamente necessaria per ogni espressione aggettivale.

Ma se l’espressione è il nome di un particolare noi non facciamo alcuna distinzione del genere; l’unico insieme di proposizioni determinate da “Socrate” è l’insieme di quelle in cui Socrate compare in qualsiasi modo, come i valori di

Schermata 2013-09-30 alle 10.12.51

(Questo è per dire che questo è l’unico di tali insiemi che noi possiamo considerare). Così che non vi è alcuna necessità di utilizzare al posto di Socrate una espressione di funzione come

Schermata 2013-09-30 alle 10.15.24

poiché l’insieme di valori di

Schermata 2013-09-30 alle 10.16.22

sarebbe lo stesso insieme di quello di

Schermata 2013-09-30 alle 10.17.09

o semplicemente

Schermata 2013-09-30 alle 10.17.57.

Abbiamo trovato qui la differenza essenziale tra sostantivo e aggettivo, cioè che nel caso dell’aggettivo formalmente distinguiamo un particolare insieme di proposizioni in cui compare come quelli in cui esso è predicato del soggetto, ma nel caso del sostantivo ogni proposizione in cui essa compare è considerata come predicativo di un aggettivo di esso.

Così in “Socrate è saggio “, ” Platone è saggio ” “saggio” è predicato di soggetti , ma in ” Né Platone né Socrate è saggio ” questo non è il caso, e quest’ultima proposizione non come le altre ci giustificherebbero se dicessimo “Qualcuno è saggio .” Ma ” Platone è saggio “, ” Platone è bello “, ” Platone non è né saggio né bello ” tutti gli aggettivi predicativi di Platone e consentono di affermare ” Platone ha qualche caratteristica “. O come Johnson dice “noi possiamo costruire correttamente un aggettivo composto di  ‘semplici’ aggettivi come possiamo costruire una proposizione composta di ‘semplici’ proposizioni, ma la natura di qualsiasi termine con funzioni di sostantivo è tale che è impossibile costruire un autentico sostantivo composto ” ( Logic Parte II pag. 61) 5 .

5 Cfr. W.E. Johnson, Logic, parte II, cit.

Ma questa differenza tra sostantivi e aggettivi (ovvero parole) non riflette alcuna reale distinzione tra particolari e universali. Perciò se tra gli aggettivi noi abbiamo distinto i nomi di qualità semplici, che non possiamo fare perché non abbiamo tali nomi, e tra le proposizioni in cui ” Socrate ” compare quelle che attribuiscono a lui una semplice qualità ovvero come essere ” elementare ” nel senso di Wittgenstein, allora dovremmo avere un insieme più ristretto di proposizioni che contengono “Socrate”, che potremmo chiamare valori di

Schermata 2013-09-30 alle 10.19.15

E dovremmo distinguere

Schermata 2013-09-30 alle 10.21.58=     ” Socrate ha tutte le caratteristiche” ,  così come noi distinguiamo ” ( x ) . x è rosso = ” tutte le cose sono rosse ” da

Schermata 2013-09-30 alle 10.25.09   = ” essere rosso ha tutte le caratteristiche ” , e sarebbe questo utile per simboleggiare Socrate con la funzione

Schermata 2013-09-30 alle 10.26.23.

Ciò porta all’importante conclusione filosofica che non vi è alcuna reale divisione di oggetti in particolari e universali, ma solo una distinzione di espressioni in sostantivali e aggettivali a seconda delle distinzioni che noi facciamo in relazione a loro.

Questo non vuol dire che non ci sono differenze formali tra gli oggetti, ma solo che non ci sarebbe questa grande dicotomia in particolari e universali .

Questo è il punto di Johnson che una combinazione di aggettivi da’ un vero aggettivo, ma una combinazione di sostantivi non da’ alcun autentico sostantivo. Ma il modo corretto di affermare è che, mentre si distinguono combinazioni di sostantivi dai sostantivi stessi, noi facciamo tale distinzione per gli aggettivi, perché

Schermata 2013-09-30 alle 11.02.30

E’ chiaro che in realtà non ci sono particolari e universali, ma solo oggetti di forme diverse.

Le funzioni di tipo superiore vengono come espressioni per oggetti formali introdotte da una definizione ad esempio ” Predicativo di ”

Schermata 2013-09-30 alle 10.28.56

è una definizione di f non una asserzione come Johnson sembra pensare

utile quando generalizzato, altrimenti superflua.

Questo è il testo originale:

PROPOSITIONAL FUNCTIONS AND PROPOSITIONS ARE BOTH SYMBOLS

Propositional functions and propositions are both symbols.

Russell got into a mess by treating functions as symbols, but propositions not as symbols; (he calls them “objects”) p. 41 but not p. 48 1.

1 See B. Russell and A.N. Whitehead, Principia Mathematica, Cambridge: Cambridge University Press. Vol. I, First Edition 1910

The word “function” is very misleading. We must not connect propositional and mathematical functions; to them the only thing common is a certain incompleteness which leads us to symbolise them by adding an illustrative symbol of the kind that would complete them.

Johnson’s arguments that propositional and mathematical functions are of the same kind are entirely superficial. He assimilates an epistemic statement about a proposition e.g. “φ a is dubious” to “4 = 2 + 2” making no attempt to give a satisfactory analysis of either.

The fundamental idea underlying the notion of a propositional function is that of an expression, conveniently represented by a functional symbol, since it needs to be completed to give a proposition and it is useful to indicate how.

We might say the essential characteristic of a function is incompleteness, not as Russell says ambiguity, which only comes in as to how it is to be completed.

Since the names of individuals must be completed to form a proposition, the question arises why we do not write them also as functional symbols. We shall see that this peculiar treatment of individuals has a real justification; this, however,  does not arise from a real difference between individuals and universals, but from a limitation of human language.

An Expression (not a proposition or an operation) serves as a common mark of a set of propositions, of which we wish to consider some truth – function, as, for example, that all of them are true. The set is the set of propositions obtained by significantly completing the expression; but since more than one way of completing it may be possible, we may get more than one such set.

Thus “wise” gives us the set of propositions of the form “x is wise”, and also the wider set of all propositions, of whatever form, which contain the word “wise”, including e.g. “if Plato tells the truth, Socrates is wise”. We use not “wise” but “x is wise” to indicate the way in which we complete the expression in order to obtain the narrower set of propositions,  which we often have occasion to use e.g. in saying “Some men are wise”.

We distinguish this narrower set as values of

Schermata 2013-09-30 alle 10.33.25

from the wider set of values of

Schermata 2013-09-30 alle 10.34.16

and a similar distinction is obviously required for every adjectival expression.

But if the expression is the name of an individual we make no such distinction; the only set of propositions determined by “Socrates” is the set of those in which Socrates occurs in any way whatever, the values of

Schermata 2013-09-30 alle 10.35.08

(That is to say that is the only such set which we ever consider). So that there is no need to use instead of Socrates a functional expression like

Schermata 2013-09-30 alle 10.36.07

since the set of values of

Schermata 2013-09-30 alle 10.37.37

would be the same set as those of

Schermata 2013-09-30 alle 10.38.31

or simply

Schermata 2013-09-30 alle 10.39.23

We have here found the essential difference between substantive and adjective, namely that in the case of the adjective we formally distinguish a particular set of the propositions in which it occurs as ones in which it is predicated of a subject, but in the case of the substantive any proposition in which It occurs is regarded as predicating an adjective of it.

Thus in “Socrates is wise”, “Plato is wise” “wise” is predicated of subjects, but in “Neither Plato nor Socrates is wise” this is not the case, and this last proposition would not like the others justify us in saying  “Someone is wise”. But “Plato is wise”, “Plato is beautiful”, “Plato is neither wise nor beautiful” all predicate adjectives of Plato and justify “Plato has some characteristic”, or as Mr. Johnson puts it “we may properly construct a compound adjective out of `simple` adjectives just as we may construct a compound proposition out of `simple` propositions, yet the nature of any term functioning as substantive is such that it is impossible to construct a genuine compound substantive” (Logic Part ll p. 61) 5.

5 See W.E. Johnson, Logic, Part II. cit.

But this difference between substantives and adjectives (i.e. words) does not reflect any real distinction between individuals and universals. For if among adjectives we distinguished the names of simple qualities, which we cannot do because we have no such names, and among propositions in which “Socrates” occurs those which ascribe to him a simple quality i.e. such as are “elementary” in Wittgenstein’s sense; then we should have a narrower set of propositions containing “Socrates”, which we could call values of

Schermata 2013-09-30 alle 10.40.58.

And we should have to distinguish

“(q). Socrates is q” = “Socrates has all qualities” from

Schermata 2013-09-30 alle 10.41.55

we distinguish “(x) . x is red = “all things are red” from

Schermata 2013-09-30 alle 10.42.48

would he useful to symbolise Socrates by the function

Schermata 2013-09-30 alle 10.40.58.

This leads to the important philosophical conclusion that there is no real division of objects into particulars and universals, but only a division of expressions into substantival and adjectival depending on the distinctions we make in connection with them.

This is not to say that there are no formal differences between objects, but only that there is not this great dichotomy into individuals and universals.

This is Johnson’s point that a combination of adjectivs gives a genuine adjective, but a combination of substantives no genuine substantive. But the proper way to state it is that while we distinguish combinations of substantives from substantives themselves, we make no such distinction for adjectives because

Schermata 2013-09-30 alle 10.44.11

It is clear that in reality there are not individuals and universals but just objects of different forms.

Functions of higher type come as expressions for formal entities introduced by definition e.g. “predicable of”

Schermata 2013-09-30 alle 10.45.02

is a definition of f not a statement as Johnson seems to think

useful when generalised, otherwise superfluous.

Lo scandalo dell’eresia di Avvenire. Ma non era il giornale dei vescovi?

9 Lug

Honourable_Bertrand_RussellL’editoriale di Avvenire di domenica 7 luglio ci lascia esterrefatti per la sciagurata incongruenza delle deduzioni e l’evidente superficialità del testo.
La parola che sarebbe più vicina a definire lo sconclusionato articolo è “incompetenza”.
L’autore, con l’evidente benedizione del direttore visto che si tratta dell’articolo di fondo, sostiene che esiste una correlazione tra la religione cristiana ed il capitalismo. E quindi va a dichiarare che questa origine positiva del capitalismo si è, purtroppo, trasformata in una nuova ideologia con connotazioni religiose naturalmente in contrasto con quelle cristiana.
Quando si fanno queste affermazioni che possono ferire i cristiani in quanto si considera con benevolenza il capitalismo e tutte le sue conseguenze di divisione dell’umanità in classi diverse per censo si dovrebbe avere almeno il buongusto di accompagnare queste affermazioni con le citazioni della dottrina, di eventuali encicliche e dichiarazioni di Papi o di teologi riconosciuti come non eretici.
Tutto ciò non dato reperire nell’articolo mentre, da quello che sappiamo, la filosofia liberista alla base del capitalismo è condannata ufficialmente dalla Chiesa con atti espliciti di Pio IX e Pio XII.
Inoltre il capitalismo esprime il prevalere del diritto di proprietà sui diritti essenziali dell’uomo in aperto contrasto, se non altro, con l’enciclica “Caritas in veritate” di Benedetto XVI e con le dichiarazioni di Papa Francesco fin dai primi discorsi dopo la sua elezione (per citare dati recenti).
Vorrei anche osservare che il capitalismo persegue solo l’interesse del capitale e se capita che questo sia in contrasto con il diritto alla vita, per la suddetta ideologia prevale sempre l’interesse capitalistico.
Ora il giornale dei vescovi (!?) mi dovrebbe spiegare come mai, accettando il capitalismo, almeno come ideologia anche se non come applicazione pratica (questo è quanto è scritto visto che lo considerano una derivazione del cristianesimo), faccia delle campagne contro l’aborto, l’eutanasia, ecc. Non mi sembra che nel cristianesimo esista nessuno dei principi che sono alla base del capitalismo. Vorrei ricordare che nel Vangelo c’è una diretta condanna del denaro e della ricerca di accumularlo.
Ricordiamo, solo per fare un esempio, che Gesù, interrogato se si doveva pagare il tributo a Cesare, disse “date a Cesare quel che è di Cesare” rifiutandosi persino di toccare la moneta del tributo. Infatti il denaro è, per la struttura stessa della sua creazione (signoraggio), mezzo di sottomissione al potere di chi lo crea e che pretende, da chi ne ha bisogno per effettuare delle transazioni, di consegnargli qualcosa in cambio: sia esso il lavoro o beni di proprietà ricavati con il lavoro. Quindi il capitale è il mezzo per tenere schiavi gli uomini al potere politico. Questo è in contrasto con il concetto di libertà che viene proclamato nel Vangelo e che è la base della teologia cristiana inserendosi direttamente nel concetto di Fede.
L’articolo di Avvenire sembra scritto da un redattore di un giornale laico come “Repubblica” o “Il Foglio” tendendo a dimostrare che la religione debba inserirsi nell’ambito dei giochi politici sporcandosi, se necessario, anche le mani.
Ma proprio perché ha difeso principi essenziali che andavano contro il potere politico e la schiavizzazione dell’uomo che Gesù è stato condannato a morte. E ai romani non è dispiaciuto farlo perché si metteva in discussione proprio il potere dell’uomo sull’uomo basato sulla forza degli eserciti e del denaro.
Sarebbe stato molto più accettabile il riconoscimento (cfr. Betrand Russell “Storia della filosofia occidentale”) che il marxismo è una traduzione del cristianesimo su un piano senza trascendenza. Nessuno storico o filosofo dotato di onestà mentale ha mai potuto fare una dichiarazione simile per il capitalismo.