Tag Archives: matematica

TRUTH AND PROBABILITY- Cap. VII di The Foundation of Mathematics di Frank Plumpton Ramsey

21 Giu

Dennis V. LindleyPropongo la mia traduzione del settimo capitolo di The Foundation of Mathematics di Frank Ramsey pubblicato a cura di R.B. Braithwaite.

Questo capitolo è la base dei moderni sistemi di valutazione in condizioni di incertezza. Grazie a questa magnifica elaborazione matematica di temi complessi e ragionamenti solo in parte elaborati da altri autori tra cui Wittgenstein, Donkin, Pierce e Blake Ramsey ha costruito un sistema matematico solido e straordinariamente valido per la valutazione delle scelte umane basato sull’inscindibilità dei due elementi soggettivi probabilità e utilità dell’esito delle decisioni. Questa metodologia è valida solo per un mondo non deterministico (quindi è il logico e necessario superamento del galileismo nella scienza), libero e razionale. Ramsey prende le mosse dalla contestazione, dal punto di vista logico, dell’ipotesi di Keynes che si possano costruire algoritmi per definire la probabilità in modo oggettivo. Tale metodologia è, purtroppo, ancora in uso da parte di importanti istituzioni pubbliche con la sola finalità di definire le condizioni per non avere problemi con la giustizia se si applicano queste formule. Ma generalmente determina gravi errori di valutazione in quanto rappresenta un metodo per rendere oggettiva una grandezza che non può esserlo in quanto dipende oltre che dalla storia del decisore, dal suo carattere e dal sentimento di utilità che egli attribuisce ad una determinata decisione.

La linea di pensiero di Ramsey è anche importante perché esclude la possibilità di far coincidere l’utilità delle scelte con la teoria filosofica dell’Utilitarismo (qui credo sia ben presente l’influenza di Ludwig Wittgenstein). Si tratta infatti di elementi che apparentemente e solo in taluni casi appaiono convergenti, ma in realtà sono concetti del tutto diversi. L’utilità di una decisione è un numero compreso tra 0 e 1 in quanto si può definire come la probabilità di ottenere la conseguenza migliore per effetto di una decisione.

Rammento ai lettori che il prof. Dennis V. Lindey ha pubblicato sull’argomento un libro divulgativo (Making Decisions- John Wiley and Sons Ltd- 1985) per l’uso del metodo di Ramsey che permette in modo semplice di valutare la coerenza di una decisione indicando i passaggi necessari per pervenirvi. Il concetto di coerenza per le proprie scelte, legato quindi a regole personali, è per definizione un metodo soggettivo che riguarda il singolo decisore.

Il lavoro di Lindley andrebbe completato con l’analisi delle tendenze psicologiche del decisore per rendere maggiormente utile il sistema. 

Il metodo di Keynes, che non tiene conto di questo, porta necessariamente ad errori di valutazione perché è uguale per tutti i decisori. In ultima analisi è un metodo che potrebbe essere gradito ai regimi totalitari o comunque a quei sistemi politici che non considerano la libertà un bene fondamentale e fondante della natura umana.

VII

VERITA’ E PROBABILITÀ (1926)

Dire di che quello che è che non è e di quello che non è che è, è falso mentre il dire di quello che è che è e di quello che non è che non è, è vero. – Aristotele.

Quando diverse ipotesi si presentano alla nostra mente che riteniamo essere reciprocamente esclusive ed esaustive, ma di cui non sappiamo altro, noi distribuiamo equamente la nostra convinzione tra queste…..

Ammettendo questo come motivo del modo in cui effettivamente distribuiamo la nostra convinzione in casi semplici, tutta la successiva teoria segue come deduzione del modo in cui dobbiamo distribuirla in casi complessi, se vogliamo essere coerenti. – W.F. Donkin.

L’oggetto del ragionamento è quello di scoprire, dalla considerazione di quello che già sappiamo, qualcos’altro che non sappiamo. Di conseguenza, il ragionamento è buono  se è tale da dare una vera conclusione da premesse vere, e non altrimenti. – C.S. Peirce.

La verità non può mai essere presentata come se sia da comprendere, e non come se sia da credere. – W. Blake.

PREMESSA

In questo saggio la teoria della probabilità è assunta come un ramo della logica, la logica della parziale convinzione e di materia non completamente definita; ma non vi è alcuna intenzione di implicare che questo è l’unico e anche il più importante aspetto del discorso. La probabilità è di fondamentale importanza non solo nella logica, ma anche nella scienza statistica e nella fisica, e non possiamo essere sicuri in anticipo che la più utile interpretazione di essa nella logica sarà appropriata anche nella fisica. Infatti la differenza principale di opinione fra gli statistici che per la maggior parte adotta la teoria della probabilità sulla base della frequenza e i logici che per lo più la respingono rende probabile che le due scuole stiano veramente discutendo differenti questioni, e che la parola ‘probabilità’ venga usata dai logici in un senso e dagli statistici in un altro. Le conclusioni a cui arriveremo circa il significato di probabilità in logica non devono, pertanto, pregiudicare il suo significato nella fisica.1

1 [Il capitolo finale, sulla probabilità nella scienza, è stato progettato ma non scritto. – Ndr].

SOMMARIO

(1) La teoria della frequenza

(2) La teoria di Keynes

(3) Il gradi di convinzione

(4) La logica della coerenza

(5) The Logica della verità

(1) LA TEORIA  DELLA FREQUENZA

Nella speranza di evitare alcune controversie puramente verbali, mi propongo di iniziare facendo qualche ammissione a favore della teoria della frequenza. In primo luogo, a questa teoria deve essere concesso di avere una solida base nel linguaggio comune, che utilizza spesso ‘probabilità’ praticamente come sinonimo di proporzione; per esempio, se diciamo che la probabilità di guarigione dal vaiolo è di tre quarti, si intende, credo, semplicemente che questa sia la proporzione di casi di vaiolo che guariscono. In secondo luogo, se iniziamo con quello che viene chiamato il calcolo delle probabilità, considerandolo dapprima come un ramo della matematica pura, e poi guardandosi intorno per qualche interpretazione delle formule, che devono dimostrare che i nostri assiomi sono coerenti e il nostro argomento non del tutto inutile, allora la molto più semplice e la meno controversa interpretazione del calcolo è quella in termini di frequenze. Questo è vero non solo della ordinaria matematica della probabilità, ma anche del calcolo simbolico sviluppato da Keynes; perché se nel suo a / h, a e h sono prese per essere non proposizioni, ma funzioni proposizionali o concetti-classe che definiscono classi finite, e per a/h si intende la proporzione di membri di h che sono anche membri di a, allora tutte le sue proposizioni diventano truismi aritmetici.

Oltre a queste due inevitabili considerazioni, ce n’è una terza e più importante, che io sono pronto ad assumere temporaneamente anche se non esprime la mia vera opinione. E questa è la seguente. Supponiamo di Iniziare con il calcolo matematico, e chiedere, non come prima cosa quale interpretazione di esso sia più comoda per il matematismo puro, ma quale interpretazione fornisce i risultati di maggior valore per la scienza in generale, allora può essere che la risposta sia ancora una volta un’interpretazione in termini di frequenza; questa probabilità come viene utilizzata in teorie statistiche, in particolare in meccanica statistica – il tipo di probabilità il cui logaritmo è l’entropia – è realmente un rapporto tra i numeri, di due classi, o il limite di quel rapporto. Non ci credo, ma sono disposto per ora a concedere alla teoria della frequenza che questa probabilità come utilizzata nella scienza moderna sia in realtà la stessa cosa della frequenza.

Ma, supponendo tutto ciò ammesso, rimane ancora il caso che noi abbiamo sia l’autorità del linguaggio comune sia di molti grandi pensatori per discutere sotto il titolo di probabilità quello che sembra essere piuttosto un argomento diverso, la logica della convinzione parziale. Può darsi che, come alcuni sostenitori della teoria della frequenza hanno sostenuto, la logica della convinzione parziale si troverà alla fine essere semplicemente lo studio delle frequenze, sia perché la convinzione parziale sarebbe definibile come, o per relazione, una sorta di frequenza, o perché può essere oggetto di un trattamento logico solo quando si fonda sulla frequenze sperimentali. Se queste affermazioni sono valide possono tuttavia essere stabilite solo come un risultato della nostra indagine sulla convinzione parziale, così che io propongo di ignorare la teoria della frequenza al presente e avviare un’indagine sulla logica della convinzione parziale. In questo, credo, sarà più conveniente se, invece di sviluppare da subito la mia teoria, comincio esaminando le opinioni di Keynes, che sono così ben conosciute e in sostanza così ampiamente accettate che i lettori probabilmente credono che non vi sia alcun motivo per riaprire il tema de novo fino a quando siano state demolite.

(2) LA TEORIA DI KEYNES

Keynes 1 parte dal presupposto che facciamo inferenze di probabilità per le quali asseriamo una validità oggettiva; si procede dalla convinzione piena in una proposizione alla convinzione parziale in un’altra, e noi riteniamo che questa procedura è oggettivamente giusta, in modo che se un altro uomo in circostanze simili avesse un diverso grado di convinzione, in questo sbaglierebbe. La ragione di questa ipotesi di Keynes è di supporre  che fra due qualsiasi proposizioni, date come premesse e conclusioni, esiste solo una ed una sola relazione di un determinato tipo definito relazione di probabilità;  e questo se, in qualsiasi caso dato, la relazione sia di grado α, dalla totale convinzione nelle premessa, noi possiamo, se siamo razionali, pervenire ad un grado di convinzione α nella conclusione.

Prima di criticare questo punto di vista, potrebbe forse essermi consentito di segnalare un evidente e facilmente correggibile difetto nella sua definizione. Quando viene detto che il grado della relazione di probabilità è la stessa del grado di convinzione che la giustifica, sembra essere presupposto che sia i rapporti di probabilità, da un lato, ed i gradi di convinzione, dall’altro possano essere naturalmente espressi in termini numerici e quindi che il numero che esprime o misura il rapporto di probabilità è lo stesso che esprime l’appropriato grado di convinzione. Ma se, come sostiene Keynes, queste cose non sono sempre esprimibili con i numeri, allora non possiamo porre la sua affermazione che il grado dell’una  sia lo stesso dell’altra come una semplice interpretazione, ma si deve supporre che pensi soltanto che esista una corrispondenza biunivoca tra i rapporti di probabilità e i gradi di convinzione che li giustificherebbe. Questa corrispondenza deve conservare evidentemente le relazioni di maggiore e minore, e rendere la varietà delle relazioni di probabilità e quella di gradi di convinzione simili nel senso di Russell. Penso che sia un peccato che Keynes non ha visto questo chiaramente, perché l’esattezza di questa corrispondenza avrebbe fornito materia abbastanza degna per il suo scetticismo come fece sulla misura numerica dei rapporti di probabilità. Infatti alcuni dei suoi argomenti contro la loro misura numerica sembra si applichino abbastanza altrettanto bene contro la loro esatta corrispondenza con i gradi di convinzione; per esempio, sostiene che se i tassi di assicurazione corrispondessero a soggettivi, cioè reali, gradi di convinzione, questi non sarebbero razionalmente determinati, e non potremmo dedurre che le relazioni di probabilità possano essere misurate allo stesso modo. Si potrebbe sostenere che la vera conclusione in tal caso non sarebbe che, come pensa Keynes, alla relazione non -numerica di probabilità  corrisponda un non-numerico grado di convinzione razionale, ma che i gradi di convinzione, che sarebbero sempre numerici, non hanno una corrispondenza biunivoca con le relazioni di probabilità che le giustificano. Perché è, suppongo, concepibile che i gradi di convinzione possano essere misurati da uno psicogalvanometro o qualche strumento simile, e Keynes difficilmente desidererebbe che da ciò seguirebbe che i rapporti di probabilità possano essere per derivazione misurati con le misure delle convinzioni che li giustificano.

1 J.M. Keynes, A Treatise on Probability (1921).

Ma torniamo a una critica più fondamentale delle opinioni di Keynes, che è quell’ovvietà che realmente non sembra che esistano oggetti come i rapporti di probabilità che lui descrive. Lui suppone che, comunque in alcuni casi, possano essere percepiti; ma per quanto mi riguarda mi sento fiducioso che questo non è vero. Io non li percepisco, e se devo essere convinto che esistono, deve essere fatto con ragione; inoltre ho avvedutamente il sospetto che anche gli altri non li percepiscano, perché sono in grado di raggiungere un così piccolo accordo come con quello di essi che si riferisce ad ogni due date proposizioni. Tutto quello che sembra di sapere su di questo sono alcune proposizioni generali, le leggi di addizione e moltiplicazione; è come se tutti conoscessero le leggi della geometria, ma nessuno potesse dire se ogni determinato oggetto fosse rotondo o quadrato; e trovo difficile immaginare come una massa così grande di conoscenza generale possa essere combinata con una così esigua riserva di fatti particolari. E’ vero che su alcuni casi particolari vi sia un accordo, ma questi in qualche modo, paradossalmente, sono sempre immensamente complicati; siamo tutti d’accordo che la probabilità di una moneta lanciata sia testa è 1/2, ma nessuno di noi può dire esattamente quale è la prova che costituisce l’altro termine per la relazione di probabilità intorno alla quale noi stiamo facendo valutazioni. Se, invece, prendiamo le più semplici  coppie possibili di proposizioni come ‘Questo è rosso’ e ‘Questo è blu’ o ‘Questo è rosso’ e ‘Quello è rosso’, le cui relazioni logiche dovrebbero essere le relazioni sicuramente più facili da osservare, nessuno, credo, avrebbe la presunzione di essere sicuro di quale sia la relazione di probabilità che le collega. O, forse, si può pretendere di vedere la relazione, ma non saranno in grado di dire nulla su di essa con certezza, di affermare se sia più o meno di 1/3, o così via. Essi possono, naturalmente, dire che è incomparabile con qualsiasi rapporto numerico, ma una relazione su ciò che così poco può essere detto in modo veritiero sarebbe di scarso uso scientifico e sarebbe difficile convincere uno scettico della sua esistenza. Inoltre questo punto di vista è davvero un po’ paradossale, perché ogni persona che crede nell’induzione deve ammettere che tra ‘Questo è rosso’ come conclusione e ‘Questo è rotondo’, insieme a un miliardo di proposizioni della forma ‘a è rotondo e rosso ‘come prova, c’è una relazione di probabilità finita; ed è difficile supporre che come abbiamo accumulato casi di prova questi sono improvvisamente ad un punto, ad esempio dopo 233 prove, nel quale la relazione di probabilità diventa finita e così comparabile con qualche rapporto numerico.

Mi sembra che se prendiamo le due proposizioni ‘a è rosso’, ‘b è rosso’, non possiamo discernere più di quattro semplici relazioni logiche tra di esse, vale a dire l’identità di forma, identità di predicato, la diversità del soggetto, e l’indipendenza logica di significato. Se qualcuno mi chiedesse quale probabilità darei all’una e all’altra, non dovrei cercare di rispondere meditando sulle proposizioni e cercando di discernere una relazione logica tra di esse, dovrei, piuttosto, provare ad immaginare che una di quelle sia  tutto quello che sapevo, e ad indovinare quale grado di convinzione dovrei avere poi nell’altra. Se io sono stato in grado di fare questo, potrei senza dubbio ancora non essere contento con questo, ma potrei dire ‘Questo è quello che penserei, ma, naturalmente, io sono solo un pazzo ‘e procederei a considerare ciò che un uomo saggio potrebbe pensare e chiamare questo il grado di probabilità. Io discuterò più tardi questo tipo di autocritica, quando svilupperò la mia teoria; tutto ciò che voglio sottolineare qui è che nessuno che valuta un grado di probabilità prende in considerazione semplicemente  le due proposizioni che si suppone essere correlate con esso; egli sempre considera, tra l’altro il suo proprio grado di convinzione effettivo o ipotetico. Questa osservazione mi sembra essere confermata dalla osservazione del mio comportamento; e per essere l’unico modo di rendere conto del fatto che tutti possiamo fornire stime di probabilità in casi presi dalla vita reale, ma siamo del tutto incapaci di farlo nei casi logicamente più semplici in cui, fosse la probabilità una relazione logica, sarebbe più facile da discernere.

Un altro argomento contro la teoria di Keynes può, credo, essere tratto dalla sua incapacità di aderire ad essa coerentemente anche nella discussione principi primi. C’è un passaggio nel suo capitolo sulla misura della probabilità che recita quanto segue: “La probabilità, vedi capitolo 11 (§ 12), relativa in un certo senso ai principi della ragione umana. Il grado di probabilità, che è razionale per noi prendere in considerazione, non ha la pretesa di una intuizione logica perfetta, ed è relativa in parte alle proposizioni secondarie che in realtà conosciamo; e non dipende se una visione logica più perfetta è o non è concepibile. E’ il grado di probabilità a cui conducono questi processi logici, di cui le nostre menti sono capaci; o, nel linguaggio del capitolo II, che quelle proposizioni secondarie giustificano, che in realtà conosciamo. Se non assumiamo questo punto di vista sulla probabilità, se non la limitiamo in questo modo e lo rendiamo, fino a questo punto, relativamente ai poteri umani, siamo del tutto alla deriva nell’ignoto; perché non possiamo mai sapere quale grado di probabilità sarebbe giustificato dalla percezione di relazioni logiche che noi siamo, e sempre dobbiamo essere, incapaci di comprendere.” 1

Questo passaggio mi sembra abbastanza inconciliabile con il punto di vista che Keynes adotta dappertutto tranne in questo e un altro passo simile. Perché egli sostiene in generale che il grado di convinzione che siamo giustificati nel mettere alla conclusione di un argomento è determinato da quale relazione di probabilità unisce tale conclusione alle nostre premesse. C’è un solo rapporto di questo tipo e di conseguenza una sola vera pertinente proposizione secondaria, che, ovviamente, posso o non posso conoscere, ma che è necessariamente indipendente dalla mente umana. Se noi non lo sappiamo, non lo sappiamo e non possiamo dire quanto dovremmo credere nella conclusione. Ma spesso, egli suppone, che noi lo sappiamo;  i rapporti di probabilità non sono quelli che siamo incapaci di comprendere. Ma su questo punto di vista l’argomento del passo sopra citato non ha alcun significato: le relazioni che giustificano le probabili convinzioni sono relazioni di probabilità, e non ha senso dire di loro che sono giustificate da relazioni logiche che noi siamo, e dobbiamo sempre essere, incapaci di comprendere.

Il significato del passaggio per il nostro scopo attuale sta nel fatto che esso sembra presupporre un diverso punto di vista sulla probabilità, in cui rapporti di probabilità indefinibili non giocano alcun ruolo, ma in cui il grado di convinzione razionale dipende da una varietà di relazioni logiche. Per esempio, ci potrebbe essere tra la premessa e la conclusione la relazione che la premessa era il prodotto logico di un migliaio esempi di una generalizzazione la conclusione della quale era un altro esempio, e questa relazione, che non è un rapporto di probabilità indefinibile ma definibile in termini di logica ordinaria e così facilmente riconoscibile, potrebbe giustificare un certo grado di convinzione nelle conclusioni da parte di uno che credesse nelle premesse. Dovremmo quindi avere una varietà di ordinarie relazioni logiche che giustificano lo stesso o gradi diversi di convinzione. Dire che la probabilità di a dato h era così e così significherebbe che tra a e h esiste una relazione che giustifichi tale-e-tale grado di convinzione. E da questo punto di vista sarebbe un vero e proprio punto essenziale che la relazione in questione non deve essere una relazione che la mente umana sia incapace di comprendere.

1 p. 32, corsivo nel testo.

Questo secondo punto di vista della probabilità come dipendente da relazioni logiche, ma non per sé una nuova relazione logica mi sembra più plausibile della usuale teoria di Keynes; ma questo non vuol dire che mi sento affatto propenso a concordare con lui. Questo richiederebbe  l’idea un po ‘oscura di una relazione logica che giustifica un  grado di convinzione, che non vorrei accettare come indefinibile perché non sembra essere del tutto un concetto chiaro e semplice. Inoltre è difficile dire quali relazioni logiche giustificano quali gradi di convinzione, e perché; qualsiasi decisione in questo senso sarebbe arbitraria, e porterebbe ad una logica di probabilità costituita da una moltitudine di cosiddetti “necessari” fatti, come la logica formale secondo il punto di vita di  Chadwick sulle constanti logiche. 1 Al contrario io penso sia molto meglio cercare una spiegazione di questa ‘necessità sul modello di lavoro di Wittgenstein, che ci permette di vedere chiaramente in quale preciso senso e perché le proposizioni logiche sono necessarie, e in maniera generale perché il sistema della logica formale è composto di  proposizioni di cui è composto, e quale è la sua caratteristica comune. Come la scienza naturale cerca di spiegare e calcolare i fatti della natura, così la filosofia dovrebbe cercare, in un certo senso, di spiegare e calcolare i fatti di logica; un compito ignorato dalla filosofia che respinge questi fatti come non calcolabili e in un senso indefinibile ‘necessari’.

Qui mi propongo di concludere questa critica della teoria di Keynes, non perché non ci siano altri aspetti nei quali sembra offrire il fianco ad obiezioni, ma perché spero che quello che ho già detto sia sufficiente a dimostrare che non è così del tutto soddisfacente da rendere inutile qualsiasi tentativo di trattare la teoria da un punto di vista piuttosto diverso.

J.A. Chadwick “Logical Constants”, Mind, 1927.

(3) GRADI DI CONVINZIONE

L’oggetto della nostra indagine è la logica della convinzione parziale, e non credo che possiamo affrontarla a meno che abbiamo almeno una nozione approssimativa di ciò che sia la convinzione parziale, e come, se non altro, può essere misurata. Non sarà molto illuminante sentirsi dire che in certe circostanze sarebbe razionale credere una proposizione nella misura di 2/3, a meno che sappiamo che cosa significa questo tipo di convinzione in ciò. Dobbiamo quindi cercare di sviluppare un metodo puramente psicologico della misura della convinzione. Non è abbastanza misurare la probabilità; al fine di assegnare correttamente la nostra convinzione alla probabilità dobbiamo anche essere in grado di misurare la nostra convinzione. E’ comune opinione che la convinzione e altre variabili psicologiche non siano misurabili, e se questo fosse vero la nostra indagine sarebbe vana;  e così sarebbe tutta la teoria della probabilità concepita come la logica della parziale convinzione; perché se la frase ‘una convinzione di due terzi di certezza’ fosse priva di significato, un calcolo il cui unico obiettivo sia imporre tali convinzioni sarebbe anche privo di senso. Quindi a meno che non siamo disposti a rinunciare a tutta la faccenda come un cattivo lavoro noi siamo tenuti a sostenere che le convinzioni possono in qualche misura essere misurate. Se dovessimo seguire l’analogia di Keynes nel trattare le probabilità dovremmo dire che alcune convinzioni sarebbero misurabili e altre no; ma questa probabilmente non mi sembra essere un considerazione corretta della questione: non vedo come si possa dividere nettamente le convinzioni in quelle che hanno una posizione nella scala numerica e quelli che non l’hanno. Ma penso che le convinzioni si differenziano in misurabilità nei seguenti due modi. In primo luogo, alcune convinzioni  possono essere misurate più accuratamente di altre; e, in secondo luogo, la misurazione delle convinzioni è abbastanza certamente un processo ambiguo che conduce ad una risposta variabile a seconda di come esattamente la misurazione viene effettuata. Il grado di convinzione a questo proposito è come l’intervallo di tempo tra due eventi; prima di Einstein si considerava che tutti i metodi ordinari di misura di un intervallo di tempo avrebbero dovuto portare allo stesso risultato se effettuata correttamente. 1  Einstein ha dimostrato che questo non era il caso; e l’intervallo di tempo non può più essere considerato come una nozione precisa, ma deve essere abbandonato in tutte le indagini precise. Tuttavia, l’intervallo di tempo e il sistema newtoniano sono sufficientemente accurati per molti scopi e più  facili da applicare. Cercherò di argomentare in seguito che il grado di una convinzione è come un intervallo di tempo; non ha un preciso significato a meno che si specifichi più precisamente come debba essere misurato. Ma per molti scopi possiamo supporre che i modi alternativi di misurarlo portano allo stesso risultato, anche se questo è solo approssimativamente vero. Le discrepanze risultanti sono più evidenti in connessione con alcune convinzioni che con altre, e queste dunque appaiono meno misurabili. Entrambi questi tipi di carenze nella misurabilità, dovuti rispettivamente alla difficoltà di ottenere una misura sufficientemente esatta e ad una importante ambiguità nella definizione del processo di misura, si verificano anche nella fisica e così non sono difficoltà peculiari del nostro problema; quello che è peculiare è che è difficile formulare qualsiasi idea di come la misurazione debba essere effettuata, come l’unità di misura si debba ricavare, e così via. Consideriamo quindi ciò che è implicito nella misurazione delle convinzioni. Un sistema soddisfacente deve in primo luogo assegnare ad ogni convinzione una grandezza o misura avente una precisa posizione in un ordine di grandezza; convinzioni che siano dello stesso grado di convinzione devono  avere la stessa misura dell’una e dell’altra, e così via. Naturalmente questo non può essere realizzato senza introdurre una certa quantità di ipotesi o invenzioni. Anche in fisica non si può sostenere che oggetti che sono uguali a qualche cosa siano uguali l’uno all’altro senza porre ‘uguale’ non con il significato ‘percettibilmente uguale’, ma come un’invenzione o una relazione ipotetica. Non voglio discutere la metafisica o epistemologia di questo processo, ma solo  sottolineare che se è ammissibile in fisica, sarà anche ammissibile in psicologia. La semplicità logica caratteristica delle relazioni trattate in una scienza non viene ottenuta per sua sola natura senza alcuna mescolanza con l’invenzione. Ma il costruire una tale serie ordinata di gradi non è tutto l’insieme del nostro lavoro; dobbiamo anche assegnare valori numerici a questi gradi in qualche modo intelligibile. Ovviamente possiamo facilmente spiegare che indichiamo piena convinzione con 1, la convinzione piena nell’opposto con 0, e le uguali convinzioni in una proposizione e la sua contraddizione con 1/2. Ma non è così semplice dire cosa si intende con una convinzione di certezza pari a 2/3, o che una convinzione in una proposizione sia due volte più forte che la sua contraddizione. Questa è la parte più difficile del lavoro, ma è assolutamente necessaria; perché noi calcoliamo le probabilità numeriche, e se queste corrispondono al grado di convinzione noi dobbiamo scoprire qualche modo definito di assegnare numeri ai gradi di convinzione. In fisica spesso si attribuiscono i numeri scoprendo un processo fisico di addizione 1: il numero per la misura di lunghezze non viene assegnato arbitrariamente soggetto soltanto alla condizione che una maggiore lunghezza deve avere una misura più grande; noi la determiniamo ulteriormente stabilendo un significato fisico per l’addizione; la lunghezza ottenuta mettendo insieme due date lunghezze deve avere per la sua misura la somma delle singole misure. Un sistema di misura in cui non vi è nulla che corrisponde a questo viene immediatamente riconosciuto come arbitrario, per esempio la scala di durezza 1 di Mohs in cui 10 è assegnato arbitrariamente al diamante, il materiale più duro conosciuto, 9 al successivo più duro, e così via.

1 Vedi N. Campbell, Physics The Elements (1920), p.277.

1 Ibid., p.271.

Dobbiamo quindi trovare un processo di addizione per i gradi di convinzione, o un qualche  sostituto a questo che sia ugualmente adeguato a definire una scala numerica. Questo è il nostro problema: come si risolve? Ci sono, credo, due modi da cui possiamo iniziare. Possiamo, in primo luogo, supporre che il grado di una convinzione sia qualcosa di percepibile da chi lo possiede; ad esempio che le convinzioni differiscano nell’intensità della sensazione da cui sono accompagnate, che potrebbe essere chiamata un sentimento di convinzione o sensazione di convincimento, e che per grado di convinzione intendiamo l’intensità di questo sentimento. Questo punto di vista sarebbe molto scomodo, perché non è facile attribuire numeri all’intensità dei sentimenti; ma a parte questo mi sembra palesemente falso, perché le convinzioni che abbiamo più fortemente sono spesso accompagnate praticamente affatto da nessuna sensazione;  nessuno sente fortemente cose che dà per scontate. Siamo quindi condotti alla seconda ipotesi che il grado di una convinzione sia una proprietà causale di ciò, che possiamo esprimere vagamente come il campo di applicazione in cui siamo pronti ad agire con esso. Questa è una generalizzazione del noto punto di vista, che la differenza di convinzione sta nella sua efficacia causale, che viene discusso da Russell nella sua Analysis of Mind. Egli in quell’opera la respinge per due motivi, uno dei quali sembra completamente mancare il punto. Egli sostiene che nel corso della serie dei pensieri, noi concepiamo molte cose che non danno luogo ad azione. Questa obiezione, tuttavia, è vicina a cogliere nel segno, in quanto non si afferma che una convinzione sia un’idea che effettivamente porta ad una azione, ma che porterebbe all’azione in opportune circostanze; proprio come una zolletta di arsenico è detta velenosa, non perché in realtà ha ucciso o ucciderà qualcuno, ma perché potrebbe uccidere chiunque la mangiasse. Il secondo argomento di Russell, tuttavia, è più arduo. Egli fa notare che non è possibile supporre che le convinzioni differiscano dalle altre idee solo per i loro effetti, perché altrimenti se fossero identiche anche i loro effetti sarebbero identici. Questo è perfettamente vero, ma può ancora restare il caso che la natura della differenza tra le cause sia o completamente sconosciuta o molto vagamente nota, e che quello di cui vogliamo parlare sia la differenza tra gli effetti, che è immediatamente osservabile e rilevante. Non appena noi consideriamo una convinzione quantitativamente, questo mi sembra l’unico punto di vista che possiamo avere su di essa. Si potrebbe giustamente considerare che la differenza tra credere e non credere stia nella presenza o assenza di sentimenti introspettivamente. Ma quando cerchiamo di conoscere quale sia la differenza tra credere con più certezza e credere con meno certezza, non possiamo più considerarlo come definibile nell’avere più o meno di una certa sensazione osservabile; almeno io personalmente non sono in grado di riconoscere sentimenti di questo genere. Mi sembra che la differenza si trovi in fino a che punto dovremmo agire in base a queste convinzioni: questo può dipendere dal grado di qualche sensazione o sensazioni, ma non so esattamente quali sensazioni e non penso che sia indispensabile che le conosciamo. Proprio la stessa cosa si trova nella fisica; si è trovato che un cavo che collega lastre di zinco e rame poste in un acido devia un ago magnetico posto nelle sue vicinanze. Di conseguenza, se l’ago viene più o meno deviato si dice che il filo elettrico porta una corrente più o meno grande. La natura di questa ‘corrente’ può essere solo ipotizzata: quello che viene osservato e misurato sono semplicemente i suoi effetti. Si può senza dubbio obiettare che noi sappiamo con quanta forza crediamo in oggetti, e che possiamo conoscere questo solo se siamo in grado di misurare la nostra convinzione per introspezione. Questo non mi sembra necessariamente vero;  in molti casi, credo, il nostro giudizio sulla forza della nostra convinzione è realmente su come agiremmo in ipotetiche circostanze. Si potrebbe rispondere che possiamo solo dire come agiremmo osservando l’attuale sensazione di convincimento che determina il modo in cui agiremmo; ma ancora una volta dubito la cogenza dell’argomento. E’  possibile che ciò che determina il modo in cui agiremmo ci determina anche, direttamente o indirettamente ad avere una corretta opinione su come agiremmo,  senza che ciò mai giunga nella consapevolezza. Supponiamo, tuttavia, che mi sbagli su questo e che possiamo decidere per introspezione la natura della convinzione, e misurarne il grado; pertanto, io sosterrei, il tipo di misura di convinzione con cui la probabilità è interessata non è di questo tipo, ma è una misura della convinzioni su qualche base di azione. Questo io penso si possa mostrare in due modi. In primo luogo, considerando la scala di probabilità tra 0 e 1, e il tipo di modo di usarlo, vedremo che è molto appropriato per la misura della convinzione come base di un’azione, ma in nessun modo correlato alla misura di una introspettiva sensazione. Perché le unità nei termini in cui  sono misurate tali sensazioni o sentimenti sono sempre, penso, differenze che sono appena percettibili: non c’è altro modo di ottenere tali unità. Ma non vedo alcuna ragione per supporre che l’intervallo tra una convinzione di grado 1/3 e una di grado 1/2 sia composto da alquante appena percettibili modifiche così come quella tra una di 2/3 ed una di 5/8, o che questa scala basata su appena percettibili differenze non avrebbe alcuna semplice relazione con la teoria della probabilità. D’altra parte la probabilità di 1/3 è chiaramente correlata al tipo di convinzione che porterebbe ad una scommessa di 2 a 1, e verrà illustrato di seguito come generalizzare questo rapporto in modo da applicarlo ad una azione in generale. In secondo luogo, gli aspetti quantitativi di convinzioni come base di azione sono evidentemente più importanti dell’intensità di una sensazione di convinzione. Questi ultimi sono senza dubbio interessanti, ma possono essere molto variabile da individuo a individuo, e il loro interesse pratico è interamente dovuto alla loro posizione di ipotetiche cause di convinzione per qualche fondamento di una azione. E’ possibile che qualcuno dirà che la misura in cui dovremmo agire sulla base di una convinzione in opportune circostanze è un oggetto ipotetico, e quindi non soggetto a misurazione. Ma dire questo è solo il rivelare l’ignoranza delle scienze fisiche che costantemente si occupano di misurare quantitativi ipotetici; per esempio, l’intensità elettrica in un dato punto è la forza che agirebbe su una carica unitaria se fosse messa in un dato luogo. Cerchiamo ora di trovare un metodo di misurare le convinzioni come fondamento di azioni possibili. E’ chiaro che noi siamo interessati all’intenzione piuttosto che alle convinzioni realizzate; vale a dire, non con le convinzioni al momento in cui pensiamo ad esse, ma alle mie convinzioni come la mia convinzione che la terra è rotonda, a cui raramente penso, ma che guiderebbe la mia azione in ogni caso in cui fosse rilevante. Il vecchio consolidato modo di misurare la convinzione di una persona è quello di proporre una scommessa, e vedere quale sarebbe la più bassa posta che egli accetterebbe. Considero questo metodo fondamentalmente valido, ma ha il difetto di non essere abbastanza generale, e di essere necessariamente inesatto. E’ inesatto parzialmente  a causa del decrescere dell’utilità marginale del denaro, in parte perché una persona può avere entusiasmo o riluttanza a scommettere, perché o gode o detesta questa emozione o per qualsiasi altro motivo, ad esempio, per scrivere un libro. La difficoltà è simile a quella di separare due differenti forze co-operanti. Inoltre, la proposta di una scommessa può alterare inevitabilmente lo stato della sua opinione; così come non potremmo sempre misurare l’intensità elettrica con una effettiva introduzione di una carica elettrica e osservando a quale forza essa è soggetta, perché l’introduzione di una carica cambia la distribuzione che si vuole misurare. Al fine quindi di costruire una teoria quantitativa della convinzione che sarebbe insieme generale ed più esatta, mi propongo di prendere come fondamento una teoria psicologica generale, che è ormai universalmente abbandonata, ma risulta comunque, credo, abbastanza vicina alla verità in una sorta di casi in cui noi siamo più interessati. Mi riferisco alla teoria che noi agiamo nel modo che pensiamo che più probabilmente realizzi gli oggetti del nostro desiderio, in modo che le azioni di una persona sono completamente determinate dai suoi desideri e dalle sue opinioni. Questa teoria non può risultare adeguata a tutti i fatti, ma mi sembra una utile approssimazione alla verità, soprattutto nel caso della nostra vita cosciente o professionale, ed è implicata in grande accordo con il nostro pensiero. Si tratta di una teoria semplice e una teoria che molti psicologi ovviamente gradirebbero mantenere attraverso l’introduzione di desideri inconsci e opinioni inconsce in al fine di renderla più in armonia con i fatti. Non mi sento di giudicare fino a che punto tali ipotesi possano ottenere i risultati richiesti: io solo l’affermo per ciò che segue da una verità approssimativa, o la verità in relazione a questo sistema artificiale di psicologia, che, come la meccanica newtoniana può, io credo, ancora essere utilizzata con profitto anche se è noto per essere errata. Si deve rilevare che questa teoria non deve essere identificata con la psicologia degli Utilitaristi, in cui il piacere ha una posizione dominante. La teoria che propongo di adottare è che cerchiamo le cose che vogliamo, che possono essere per nostro o di altrui piacere, o una qualsiasi altra cosa, e le nostre azioni si verificano per come riteniamo più probabile ottenere questi beni. Ma questa non è una precisa formulazione, perché una precisa formulazione della teoria può essere fatta solo dopo aver introdotto la nozione quantitativa di convinzione. Chiamiamo le cose che una persona desidera in definitiva, ‘beni’, e assumiamo in un primo momento che siano numericamente misurabili e additivi. Vale a dire che se lui preferisce di per sé un’ora di nuoto ad un’ora di lettura, egli preferirà due ore di nuoto a un’ora di nuoto e ad un’ora di lettura. Questo è ovviamente assurdo nel caso specifico, ma questo potrebbe essere solo perché il nuoto e la lettura non sono beni fondamentali, e perché non possiamo immaginare una seconda ora di nuoto esattamente simile alla prima, a causa dell’affaticamento, ecc. Cominciamo col supporre che il nostro soggetto non ha dubbi su nulla, ma sicure opinioni su tutte le proposizioni. Allora possiamo dire che sempre sceglierà il corso di azioni che porteranno secondo la sua opinione alla massima somma di bene. Va sottolineato che in questo esempio bene e male non sono da intendersi in nessun senso etico, ma semplicemente per indicare quello per cui una persona prova desiderio o avversione. Il problema quindi si pone su come dobbiamo modificare questo semplice sistema per tener conto dei diversi gradi di certezza nelle sue convinzioni. Suggerisco che si introduca come legge psicologica che il suo comportamento sia governato da quello che viene chiamato la speranza matematica; vale a dire che, se p è una proposizione su cui egli ha dubbi, ogni bene o male per la cui realizzazione p è a suo avviso una condizione necessaria e sufficiente entrerà nei suoi calcoli moltiplicata per quella frazione, che verrebbe chiamata il ‘grado della sua convinzione in p’. Definiamo così il grado di convinzione in un modo che presuppone l’uso della speranza matematica. Questo si può porre in un modo diverso. Supponiamo che il suo grado di convinzione in p sia m/n; allora la sua azione sarebbe tale come se egli dovesse scegliere di ripeterla esattamente n volte, in m volte delle quali p sarebbe vera, e nelle altre falsa. [Qui sarebbe necessario supporre che in ciascuna delle n volte egli non abbia memoria delle precedenti.] Questo può anche essere preso come una definizione del grado di convinzione, e può essere facilmente considerato come equivalente alla definizione precedente. Diamo un esempio del tipo di casi che potrebbero verificarsi. Io sono ad un bivio e non conosco la strada, ma io piuttosto penso che una delle due strade è quella giusta. Propongo quindi di andare in quella direzione, ma tengo gli occhi aperti per qualcuno a cui chiedere; se adesso vedo qualcuno a mezzo miglio di distanza oltre i campi, se devio per chiedere a lui dipenderà dal relativo disagio di andare fuori dalla mia strada per attraversare i campi o di proseguire sulla strada sbagliata se si tratta della strada sbagliata. Ma dipenderà anche da come sono sicuro che ho ragione; e chiaramente più Io sono sicuro di questo minore sarà la distanza che sarei disposto a percorrere dalla strada (in cui mi trovo) per controllare la mia opinione. Propongo pertanto di utilizzare la distanza che sarei disposto a percorrere per chiedere, come misura della fiducia nella mia opinione; e quello che ho detto sopra spiega come questo deve essere fatto. Possiamo iniziare come segue: supponiamo che l’inconveniente di percorrere x iarde per chiedere sia f(x), il vantaggio  di arrivare alla destinazione giusta sia r, quello di arrivare a quella sbagliata w. Quindi se proprio fossi disposto ad andare ad una distanza d per chiedere, il grado della mia convinzione che io sono sulla strada giusta sarebbe data da

Schermata 2013-12-27 alle 18.29.37

 

 

 

Per una tale azione ci sarebbe uno che mi pagherebbe per farla, se avessi dovuto agire nello stesso modo n volte, in np delle quali ero sulla strada giusta mentre nelle altre no.

Per il bene totale risultante dal non chiedere ogni volta

= npr + n(1-p) w

= nw + np (r – w)

che risulta dal chiedere ad una distanza x ogni volta = nr- nf(x) [io so che vado sempre nella strada giusta]

Questo è più grande dell’espressione precedente, a condizione che

f (x) <(r – w) (1-p),

∴ la distanza critica d è collegata con p, il grado di convinzione, con la relazione f (d) = (r – w) (1-p) o

Schermata 2013-12-27 alle 18.29.37

come affermato sopra.

 

 

E’ facile vedere che questo modo di misurare la convinzione, fornisce risultati in accordo con i concetti ordinari; comunque per estensione la piena convinzione è indicata con 1, piena convinzione in negativo con 0, e pari convinzione tra due con 1/2. Inoltre, ammette la validità della scommessa come mezzo per misurare le convinzioni. Proponendo una scommessa su p diamo al soggetto una possibile condotta di azione da cui risulterebbe tanto supplementare bene per lui se p fosse vero e tanto maggiore male se p è falso. Supponendo la scommessa fosse tra bene e male invece che in denaro, egli scommetterebbe per qualsiasi migliore probabilità di quella che corrisponde al suo stato di convinzione; in realtà il suo stato di convinzione è misurato dalla probabilità che egli precisamente assumerà; ma questo è viziato, come già spiegato, per amore o odio di emozione, e per il fatto che la scommessa è in denaro e non in bene e male. Poiché è universalmente riconosciuto che il denaro ha un’utilità marginale decrescente, se si considerano le scommesse in denaro, è evidente che esse devono essere per quanto possibile di piccola posta. Ma poi di nuovo la misura è guastata introducendo il nuovo fattore di riluttanza a preoccuparsi per inezie.

Vediamo ora di scartare l’ipotesi che il bene sia additivo e immediatamente misurabile, e cerchiamo di elaborare un sistema con meno ipotesi possibili. Per cominciare supponiamo, come prima, che il nostro soggetto ha certe convinzioni su tutto; poi egli agirà in modo che ciò che crede essere le conseguenze complessive della sua azione siano le migliore possibili. Se poi avessimo il potere  dell’Onnipotente, e potessimo convincere il nostro soggetto del nostro potere, potremmo, offrendogli opzioni, scoprire come ha posto in ordine di merito tutti i possibili andamenti del mondo. In questo modo tutti i mondi possibili verrebbero posti in ordine di valore, ma non avremmo un modo esatto di rappresentarli con i numeri. Non avrebbe alcun significato l’affermazione che la differenza di valore tra α e β sia pari a quella tra γ e δ. [Qui e altrove usiamo lettere greche per rappresentare le diverse possibili totalità di eventi tra cui il nostro soggetto sceglie – le definitive organiche unità.]

Supponiamo ora che il soggetto sia in grado di dubitare; allora potremmo provare il suo grado di convinzione in diverse proposizioni facendogli offerte del tipo seguente. Preferiresti avere un mondo α in qualsiasi evento; o un mondo β se p è vero, e un mondo γ se p è falsa? Se, allora, egli fosse certo che che p fosse vero, egli semplicemente confronterebbe α e β e sceglierebbe tra questi come se non ci fossero condizioni fissate; ma se dubitasse della sua scelta non potrebbe decidere in modo così semplice. Propongo di stabilire assiomi e definizioni in merito ai principi che regolano scelte di questo tipo. Questo è, naturalmente, una versione molto schematica della situazione nella vita reale, ma è, credo, più facile da prendere in considerazione in questa forma.

Vi è innanzitutto una difficoltà che deve essere affrontata; le proposizioni p, come nel caso di cui sopra che vengono utilizzate come condizioni nelle varianti offerte possono essere tali che la loro verità o falsità è un oggetto del desiderio per il soggetto. Questo scoprirà che complica il problema, e noi dovremo assumere che ci sono proposizioni per le quali questo non è il caso, che noi chiameremo eticamente neutrali. Più precisamente una proposizione atomica p è detta eticamente neutrale se due mondi possibili che differiscono solo in relazione alla verità di p sono sempre di pari valore; e una proposizione non-atomica p è detta eticamente neutrale se tutti suoi argomenti veri 1 sono eticamente neutrali. 1 Assumo qui la teoria delle proposizioni di Wittgenstein; può essere possibile dare una definizione equivalente nei termini di qualsiasi altra teoria.

Cominciamo con la definizione del grado di convinzione 1/2 in una proposizione eticamente neutrale. Si dice che il soggetto ha un grado di convinzione 1/2 in una certa proposizione p se non ha preferenze tra le opzioni (1), α se p è vero, β se p è falsa, e (2) α se p è falsa, β se p è vera, ma ha semplicemente una preferenza tra α e β. Supponiamo per un assioma che se questo è vero per qualche coppia α, β è vero per tutte le coppie tali. 1 Ciò risulta rozzamente definendo il grado di convinzione 1/2 come quel grado di convinzione che porta all’indifferenza fra lo scommettere in un modo e scommettere nell’altro per la stessa puntata.

Il grado di convinzione 1/2 così definito può essere usato per misurare i valori numericamente nel modo seguente. Dobbiamo spiegare cosa si intende per la differenza di valore tra α e β essere uguale a quello tra γ e δ; e definiamo questo per indicare che, se p è una proposizione eticamente neutrale creduta con il grado 1/2, il soggetto non ha alcuna preferenza tra le opzioni (1) α se p è vera, δ se p è falsa, e (2) β se p è vera, γ se p è falsa.

Questa definizione può costituire la base di un sistema di misurazione dei valori nel modo seguente: –

Chiamiamo qualsiasi insieme di tutti i mondi ugualmente preferibile a un mondo dato un valore: supponiamo che, se il mondo α è preferibile a β qualsiasi mondo con lo stesso valore di α è preferibile a qualsiasi mondo con lo stesso valore di β e possiamo dire che il valore di α è maggiore di quella di β. Questa relazione ‘maggiore di’ ordina i valori in una serie. Useremo α d’ora in poi sia per il mondo sia per suo valore.

Assiomi.

(1) Vi è una proposizione p eticamente neutrale creduta con grado 1/2.

(2) Se p, q sono proposizioni cosiffatte anche l’opzione

α se p, δ se non-p è equivalente a β se p, γ se non-p

allora α se q, δ se non-q è equivalente a β se q, γ se non-q.

Definizione Nel caso di cui sopra si dice αβ = γδ.

Teoremi.  Se αβ=γδ

allora βα=δγ, αγ=βδ, γα=δβ

1 α e β si suppongono così indefinite da essere compatibili sia con p sia con non-p.

(2a) Se αβ = γδ, allora α> β è equivalente a γ> δ

e α = β è equivalente a γ = δ

(3) Se l’opzione A è equivalente all’opzione B e B a C, allora A è equivalente a C.

Teorema. Se αβ = γδ e βη = ζγ

allora  αη = ζδ

(4) Se αβ = γδ, γδ = ηζ, allora  αβ = ηζ.

(5) (α, β, γ). E ! (ικ) (ακ = βγ)

(6) (α, β). E ! (ικ) (ακ = κβ)

(7) Assioma di continuità: – Qualsiasi progressione ha un limite (ordinale).

(8) Assioma di Archimede.

Questi assiomi consentono ai valori di essere correlati biunivocamente con numeri reali in modo che se α1 corrisponde a α, ecc

αβ = γδ . ≣ . α1 – β1 = γ1 – δ1.

D’ora in poi useremo α anche per il correlato numero reale α1.

Avendo così definito un metodo di misurazione del valore possiamo ricavare un modo per misurare la convinzione in generale. Se l’opzione di α certa è indifferente con quella di β, se p è vero e γ se p è falso 1, possiamo definire il grado di convinzione del soggetto in p come il rapporto della differenza tra α e γ sulla differenza tra β e γ; che si deve supporre uguale per tutte le α, β e γ che soddisfano le condizioni. Questo valore grossolanamente per definire il grado di convinzione in p per la probabilità per cui il soggetto scommetterebbe su p, essendo la scommessa gestita nei termini di differenza di valori come definiti. La definizione si applica solo alla convinzione parziale e non include certe convinzioni; perché la convinzione di grado 1 in p, α per certo è indifferente rispetto ad α se p e per ogni β  se non-p.

Qui β deve comprendere la verità di p, γ la sua falsità; p non deve più essere eticamente neutrale. Ma dobbiamo assumere che esiste un mondo con qualsiasi valore assegnato in cui p è vero, e uno in cui p è falso.

Siamo anche in grado di definire una nuova idea molto utile – il ‘grado di convinzione in p dato q’. Questo non significa il grado di convinzione in ‘Se p allora q’, o quello in ‘p implica q’, o quella che il soggetto avrebbe in p se conoscesse q, o quella che dovrebbe avere. Esprime approssimativamente le probabilità per cui egli scommetterebbe ora su p, la scommessa sarebbe valida solo se q fosse vero. Tali scommesse condizionali venivano spesso fatte nel XVIII secolo.

Il grado di convinzione in p dato q si misura così. Supponiamo che un soggetto indifferente tra le opzioni (1) α se q vero, β se q falsa, (2) γ se p vera e q vero, δ se p falsa e q vero, β se q falso. Allora il suo grado di convinzione in p dato q è il rapporto delle differenza tra α e δ sulla differenza tra γ e δ, che dobbiamo supporre le stesse per qualsiasi, α, β, γ, δ che soddisfino le condizioni date. Questa non è la stessa cosa del grado con cui potrebbe credere in p, se credesse certo q; perché la conoscenza di q potrebbe per ragioni psicologiche alterare completamente il suo intero sistema di convincimento.

Ognuna delle nostre definizioni è stata accompagnata da un assioma di coerenza, e nella misura in cui ciò è falso, la nozione di grado di convinzione diviene non più valido. Questo ha una certa analogia con la situazione in materia di simultaneità discussa sopra.

Non ho sviluppato la logica matematica di questo nel dettaglio, perché questo, credo, sarebbe come avere un risultato con sette decimali che è valido con due soli decimali. La mia logica non può essere considerata come in grado di dare più di un di un certo tipo di procedimento che potrebbe funzionare.

Da queste definizioni e assiomi è possibile provare le leggi fondamentali della convinzione probabile (i gradi di convinzione sono compresi tra 0 e 1):

(1) Grado di convinzione in grado p + di convinzione in  Schermata 2013-11-24 alle 21.04.13    = 1

(2) Grado di convinzione in p  dato q + grado di convinzione in  Schermata 2013-11-24 alle 21.04.13  dato q = 1.

(3) Grado di credere in (p e q) = grado di convinzione in p x grado di convinzione in q dato p.

(4) Grado di convinzione in (p e q) + grado di convinzione in (p e Schermata 2013-08-23 alle 22.32.01   ) = grado di convinzione in p.

Le prime due sono di immediata comprensione. La (3) si dimostra come segue.

Sia il grado di convinzione in p = x, quello in q dato p = y.

Allora ξ certo ≣ ξ + (1-x) t se p vero, ξ – xt se p falso per qualsiasi t.

ξ + (1 – x) t se p vero ≣

ξ + (1 – x) + t (1 – y) u se ‘p e q’ veri,

ξ + (1 – x) t – yu se p vero e q falso;  per ogni u

Scegliamo u in modo che ξ + (1 – x) t – yu = ξ – xt,

cioè sia u = t / y (y ≠ 0)

Allora ξ certo ≣

ξ+ (1 – x)t + t (1 – y) t / y se p e q veri,

ξ – xt altrimenti.

∴ il grado di convinzione in ‘p e q’ =  Schermata 2013-12-28 alle 09.25.12        = xy. (t≠0)

Se y = 0, comporta t = 0.

Allora ξ certo ≣ ξ se p vero, ξ se p falso

≣ ξ + u se p vero, q vero;  ξ se p falso, q falso; ξ se p falso

≣ ξ+u, pq vero;  ξ, pq falsa

∴ grado di convinzione in pq = 0.

(4) segue da (2), (3) come segue: –

Grado di convinzione in pq = p x  quello in q dato p, dalla (3).

Allo stesso modo il grado di convinzione in p Schermata 2013-08-23 alle 22.32.01    = quello in p x quello in Schermata 2013-08-23 alle 22.32.01     dato p

∴ la  somma = grado di convinzione in p, per la (2).

Queste sono le leggi della probabilità, che abbiamo dimostrato di essere necessariamente vere per ogni insieme coerente di gradi di convinzione. Qualsiasi insieme definito di gradi di convinzione che le infrange sarebbe incoerente nel senso che ha violato le leggi di preferenza tra le opzioni, come quella che la preferenza è una relazione asimmetrica transitiva, e che se α è preferibile a β, β di certo non può essere preferibile ad α se p, β se non-p. Se la condizione mentale di chiunque viola queste leggi, la sua scelta dipenderebbe dalla forma precisa cui le opzioni gli sono state offerte, il che sarebbe assurdo. Potrebbe assumere una scommessa fatta contro di lui con la migliore astuzia e restare a perdere in ogni caso.

Troviamo, quindi, che un calcolo preciso della natura della convinzione parziale rivela che le leggi della probabilità sono leggi di coerenza, un’estensione alle convinzioni parziali della logica formale, la logica della coerenza. Esse non dipendono per il loro significato da qualsiasi grado di convinzione in una proposizione che risulti essere univocamente determinata come una proposizione razionale: ma semplicemente distinguono gli insiemi di convinzioni che vi obbediscono come quelle coerenti. Avere un qualsiasi grado definito di convinzione implica un certo grado di coerenza, vale a dire la volontà di scommettere su una proposizione data con la stessa probabilità per ogni puntata, essendo la puntata misurata in termini di valori massimi.

Avere gradi di convinzione che obbediscono alle leggi della probabilità implica un’ulteriore misura di coerenza, vale a dire una tale coerenza tra le probabilità accettabili su diverse proposizioni da impedire a una scommessa fatta contro di voi.

Alcune considerazioni conclusive su questa sezione non sarebbero fuori luogo. In primo luogo, queste considerazioni si basano fondamentalmente sulle scommesse, ma questo non sembra irragionevole quando si si sia considerato che in tutta la nostra vite stiamo un certo senso scommettendo. Ogni volta che andiamo alla stazione stiamo scommettendo che un treno effettivamente camminerà, e se non avessimo un sufficiente grado di fiducia in questo rifiuteremmo la scommessa e rimarremmo a casa. Le opzioni che Dio ci da’ sono sempre subordinate al nostro indovinare se una certa proposizione è vera. In secondo luogo, si basa tutto sul concetto di speranza matematica; l’insoddisfazione spesso sentita con questa idea è dovuta principalmente alla misura imprecisa del bene. Chiaramente le aspettative matematiche in termini di denaro non sono adatte guide per il comportamento. Va ricordato, nel giudicare il mio sistema, che in esso un valore viene effettivamente definito mediante la speranza matematica in caso di convinzione di grado 1/2, e così possiamo attenderci che possa essere rappresentato adeguatamente in una scala per una utile applicazione della speranza matematica nel caso di altri gradi di convinzione.

In terzo luogo, nulla è stato detto sui gradi di convinzione quando il numero di alternative è infinito. A proposito di questo non ho niente di utile da dire, tranne che dubito che la mente sia capace di contemplare più di un numero finito di alternative. Si possono prendere in considerazione domande alle quali sia possibile un numero infinito di risposte, ma al fine di esaminare le risposte si devono riunire in un numero finito di gruppi. La difficoltà diventa praticamente rilevante quando si parla di induzione, ma anche allora mi sembra non ci sia necessità di introdurla. Possiamo discutere se l’esperienza passata fornisce un elevata probabilità al levarsi del sole domani senza preoccuparsi di quale probabilità ciò dia al sole di alzarsi ogni mattina per sempre. Per questo motivo non posso ma non intendo che la discussione del problema 1 di Ritchie sia insoddisfacente; è vero che possiamo convenire che le generalizzazioni per induzione  non richiedono nessuna probabilità finita, ma aspettative particolari intrattenute su basi induttive senza dubbio hanno una elevata probabilità numerica nelle menti di tutti noi. Siamo tutti più certi che il sole sorgerà  domani che non avrò 12 con due dadi al primo tiro, ovvero abbiamo una convinzione di grado più elevato di 35/36 in quel caso. Se mai l’induzione richiedesse una giustificazione logica  questa è in rapporto con la probabilità di un evento come questo.

1 A.D. Ritchie, “Induction and Probability”. Mind, 1926. p. 318. ‘La conclusione della discussione precedente può essere messa in modo semplice. Se il problema dell’induzione fosse posto come “Come le generalizzazioni induttive possono acquisire una grande probabilità numerica? ” allora questo è uno pseudo-problema, perché la risposta è “non possono”. Questa risposta, tuttavia,  non è una negazione della validità dell’induzione, ma è una diretta conseguenza della natura della probabilità. Lascia ancora intatto il vero problema dell’induzione che è “Come può essere aumentata la probabilità di una induzione? ” e lascia in piedi l’intera discussione di Keynes su questo punto.’

(4) LA LOGICA DELLA COERENZA

Possiamo essere d’accordo che in un certo senso sia compito della logica di dirci che cosa dobbiamo pensare; ma l’interpretazione di questa affermazione solleva notevoli difficoltà. Si può dire che dobbiamo pensare ciò che è vero, ma in questo senso ci viene detto cosa pensare da tutta la scienza e non semplicemente dalla logica. Né, in questo senso, può essere basata alcuna giustificazione per la convinzione parziale; la cosa migliore idealmente è che avremmo convinzioni di grado 1 in tutte le proposizioni vere e convinzioni di grado 0 in tutte le proposizioni false. Ma questo è un criterio troppo elevato da attendersi da uomini mortali, e dobbiamo convenire che alcuni gradi di dubbio o di errore possono essere umanamente giustificati.

Molti logici, suppongo, accetterebbero come valutazione della loro scienza le parole di apertura di Keynes nel ‘Treatise on Probability’: “parte della nostra conoscenza si ottiene direttamente, e in parte dalla ragione. La teoria della probabilità si occupa della parte che si ottiene con il ragionamento, e tratta dei diversi gradi in cui i risultati così ottenuti sono inoppugnabili o non inoppugnabili. ” Dove Keynes dice: ‘La teoria della probabilità’, altri direbbero la Logica. Si ritiene, vale a dire, che le nostre opinioni possono essere divise in quelle che possediamo immediatamente come risultato della percezione o della memoria, e quelle che ci derivano dal passato per ragionamento. E’ compito della Logica di accettare quanto viene dalla classe del passato e criticare solo la derivazione di una seconda classe da questa.

La logica come scienza del ragionamento e di inferenza è tradizionalmente e giustamente suddivisa in deduttiva e induttiva; ma la differenza e la relazione tra queste due divisioni del soggetto possono essere concepite in modi estremamente diversi. Secondo Keynes i ragionamenti deduttivi e induttivi validi sono fondamentalmente simili; entrambi sono giustificati da relazioni logiche tra premessa e conclusione che differiscono solo nel grado. Non posso accettare questa posizione, come ho già spiegato. Io non vedo cosa queste relazioni logiche inconclusive possano essere o come possano giustificare convinzioni parziali. Nel caso di ragionamenti logici inoppugnabili posso accettare la ragione della loro validità che è stata data da molte autorità, e la stessa si può trovare sostanzialmente in Kant, De Morgan, Peirce e Wittgenstein. Tutti questi autori concordano sul fatto che la conclusione di un argomento formalmente valido è contenuta nelle sue premesse; che negare la conclusione pur accettando le premesse sarebbe auto-contraddittorio; che la deduzione formale non aumenta la nostra conoscenza, ma mette in evidenza chiaramente ciò che già conosciamo in un’altra forma; e che siamo obbligati ad accettare la sua validità a meno di accettare l’incoerenza con noi stessi. La relazione logica che giustifica l’inferenza è che il senso o il valore della conclusione è contenuto in quello delle premesse.

Ma nel caso di un ragionamento induttivo questo non avviene affatto; è impossibile rappresentarlo come se somigliasse ad un ragionamento deduttivo semplicemente di grado più debole; è assurdo dire che il senso della conclusione è parzialmente contenuto in quello delle premesse. Potremmo accettare le premesse e assolutamente respingere la conclusione, senza alcun tipo di incoerenza o contraddizione. Mi sembra, quindi, che possiamo dividere i ragionamenti in due tipi radicalmente differenti, che noi possiamo riconoscere nelle parole di Peirce come (1) ‘esplicativi, analitici, o deduttivi’ e (2) ‘amplificativi, sintetici, oppure (in senso lato) Induttivi’.1 I ragionamenti del secondo tipo sono da un importante punto di vista molto più vicini ai ricordi e alle percezioni rispetto ai ragionamenti deduttivi. Possiamo considerare la percezione, la memoria e l’induzione come tre fondamentali mezzi per acquisire la conoscenza; la deduzione invece è soltanto un metodo di organizzare la nostra conoscenza e di eliminare incongruenze o contraddizioni.

La logica deve quindi rientrare decisamente in due parti: (escludendo la logica analitica, la teoria dei termini e delle proposizioni) abbiamo la logica minore, che è la logica della coerenza, o logica formale, e la logica maggiore, che è la logica della scoperta, o la logica induttiva.

Quello che abbiamo ora da osservare è che questa distinzione in alcun modo coincide con la distinzione tra certezza e convinzioni parziali; abbiamo visto che esiste una teoria della coerenza nella convinzione parziale non meno della coerenza nella convinzione certe, sebbene per vari motivi la prima non è così importante come la seconda. La teoria della probabilità è in realtà una generalizzazione della logica formale; ma nel processo di generalizzazione uno degli aspetti più importanti della logica formale è demolito.  Se p e  Schermata 2013-08-23 alle 22.32.01       non sono coerenti in modo che q segue logicamente da p, che p implica q è ciò che è chiamato da Wittgenstein una ‘tautologia’ e può essere considerato come un caso degenere di una proposizione vera che non comporti il concetto di coerenza. Questo ci permette di considerare (non del tutto correttamente) la logica formale inclusa la matematica come una scienza oggettiva costituita da proposizioni necessariamente oggettive. Questo ci fornisce non soltanto la ἀνάγκη λέγειν, che se noi affermiamo p siamo costretti dalla coerenza affermare anche q, ma anche l’ ἀνάγκη εἶναι, che se p è vero, così deve essere q. Ma quando estendiamo la logica formale per includere le convinzioni parziali tale interpretazione oggettiva esplicita è perduta;  se crediamo pq nella misura di 1/3 e p  Schermata 2013-08-23 alle 22.32.01   nella misura di 1/3 siamo costretti per coerenza a credere anche  Schermata 2013-11-24 alle 21.04.13     nella misura di 1/3.  Questo è ἀνάγκη λέγειν, ma non possiamo dire che se pq è vero per 1/3 e p Schermata 2013-08-23 alle 22.32.01     vero per 1/3, anche Schermata 2013-11-24 alle 21.04.13  deve essere vero per 1/3, perché questa asserzione sarebbe puro non senso. Lì non ci sarebbe corrispondenza ἀνάγκη εἶναι. Quindi, a differenza del calcolo di coerenza della convinzione piena, il calcolo dell’oggettiva parziale convinzione non può essere immediatamente interpretato come un corpo di oggettiva tautologia.

Questo è però possibile in modo indiretto; abbiamo visto all’inizio di questo saggio che il calcolo delle probabilità potrebbe essere interpretato in termini di rapporti di classi; ora abbiamo scoperto che può anche essere interpretato come un calcolo di coerente convinzione parziale. E’ naturale, quindi, che dovremmo aspettarci una qualche intima connessione tra queste due interpretazioni, una spiegazione della possibilità di applicare lo stesso calcolo matematico a due insiemi diversi di tali fenomeni. Nè c’è una spiegazione difficile da trovare, ci sono molte connessioni tra convinzioni parziali e frequenze. Per esempio, le frequenze sperimentate spesso portano a corrispondenti convinzioni parziali, e convinzioni parziali portano all’aspettativa di frequenze corrispondenti in accordo al teorema di Bernoulli. Ma nessuna di queste è esattamente la correlazione che vorremmo; una convinzione parziale non può in generale essere collegata univocamente con qualsiasi frequenza effettiva, perché la correlazione viene sempre realizzata prendendo la proposizione in questione come un caso di una funzione proposizionale. Quale funzione proposizionale abbiamo scelto è in qualche misura arbitraria e la frequenza corrispondente varierà notevolmente con la nostra scelta. Le pretese di alcuni esponenti della teoria della frequenza che la convinzione parziale significa piena convinzione in una proposizione sulla frequenza non può essere sostenuta.

1 C.S. Peirce Chance Love and Logic, p.92

Ma abbiamo scoperto che l’idea stessa della convinzione parziale comporta il riferimento ad una ipotetica o ideale frequenza; supponendo che il bene abbia la proprietà additiva, credere con il grado m/n è un tipo di convinzione che conduce alla azione che vorremmo fosse la migliore se ripetuta n volte in m delle quali la proposizione sia vera; o potremmo dire più brevemente che questo è il tipo di convinzione più appropriata ad un certo numero di occasioni ipotetiche altrimenti identiche nella proporzione m/n per cui la proposizione in questione è vera. E’ questa correlazione tra convinzione parziale e frequenza che ci permette di utilizzare il calcolo delle frequenze, come un calcolo di coerente convinzione parziale. E in un certo senso possiamo dire che le due interpretazioni sono gli aspetti oggettivi e soggettivi dello stesso significato recondito, così come la logica formale può essere interpretata oggettivamente come un corpo di tautologie e soggettivamente come le leggi del pensiero coerente.

Noi, credo, scopriremo che questo punto di vista del calcolo delle probabilità rimuove varie difficoltà che finora sono stati trovate sconcertanti. In primo luogo ci fornisce una evidente giustificazione degli assiomi di calcolo, che in un sistema come quello di Keynes è totalmente mancante. Perché ora si vede facilmente che se le convinzioni parziali sono coerenti obbediranno a questi assiomi, ma è assolutamente oscuro perché le misteriose relazioni logiche di Keynes dovrebbero obbedire a questi assiomi. 1 Dovremmo essere così stranamente ignoranti degli esempi di queste relazioni, e così stranamente perspicaci circa le loro leggi generali.

In secondo luogo, possiamo fare a meno del Principio di Indifferenza; noi non lo consideriamo appartenente alla logica formale nel dire che sarebbe una previsione di una persona l’estrarre una palla bianca o nera da un’urna; le sue aspettative iniziali potrebbero essere entro i limiti della coerenza qualcosa che egli preferisce; tutto quello che dobbiamo sottolineare è che se ha certe aspettative egli è tenuto per coerenza ad averne certe altre. Questo è semplicemente prendere la probabilità sullo stesso piano della normale logica formale, che non critica le premesse, ma dichiara semplicemente che alcune conclusioni sono le sole coerenti con esse. Essere in grado portare fuori dalla logica formale il Principio di Indifferenza è un grande vantaggio; perché è abbastanza evidentemente impossibile stabilire condizioni puramente logiche per la sua validità, come viene tentato da Keynes. Non voglio discutere la questione in dettaglio, perché porta alla pedanteria e a distinzioni arbitrarie che potrebbero essere discusse per sempre. Ma chi cerca di decidere con i metodi di Keynes quali siano le alternative adeguate a considerare l’equiprobabile nella meccanica delle molecole, ad esempio in Gibbs nello spazio-fase, sarà presto convinto che sia una questione di fisica piuttosto che di logica pura. Usando la formula di moltiplicazione, come viene usato nella probabilità inversa, possiamo in base alla teoria di Keynes ridurre tutte le probabilità a quozienti di probabilità a priori; ed è quindi con riguardo a questi ultimi che il principio di indifferenza è di primaria importanza, ma qui il problema non è ovviamente un problema di logica formale. Come possiamo semplicemente su basi logiche suddividere lo spettro in bande equiprobabili?

Nel sistema di Keynes appare come se gli assiomi principali – le leggi di addizione e moltiplicazione – non siano altro che definizioni. Si tratta semplicemente di un errore logico; le sue definizioni sono formalmente errate, a meno che vengano assunti i corrispondenti assiomi. Così la sua definizione di moltiplicazione presuppone la legge che se la probabilità di a dato bh è uguale a quella di c dato dh, e la probabilità di b dato h è uguale a quella di d dato k, allora la probabilità di ab dato h e di cd dato k saranno uguali.

Una terza difficoltà che viene eliminata dalla nostra teoria è quella che è presente nella teoria di Keynes nel caso seguente. Credo di percepire o ricordare qualcosa ma non sono sicuro; questo sembrerebbe darmi qualche motivo di credere, contrariamente alla teoria di Keynes,per cui il grado di convinzione che dovrei avere essendo razionale per me  è quello dato dal rapporto di probabilità tra la proposizione in questione e le cose che so per certe. Egli non può giustificare una probabile convinzione fondata non su ragionamenti ma su diretta sperimentazione. A nostro avviso non ci sarebbe niente di contrario alla logica formale, in una tale convinzione; se questo sia ragionevole dipenderà da quello che ho chiamato la grande logica che sarà il soggetto del prossimo capitolo; vedremo che non c’è nessuna obiezione a tale possibilità, con la quale il metodo di Keynes di giustificare la probabile convinzione esclusivamente attraverso relazione di conoscenza certa non è assolutamente in grado di sostenere.

(5) LA LOGICA DELLA VERITÁ

La validità della distinzione tra la logica di coerenza e la logica della verità è stata spesso contestata; è stato sostenuto da un lato che la coerenza logica è solo una specie di coerenza basata sui fatti; che se la convinzione in p non è coerente con una in q, significa semplicemente che p e q non sono entrambe vere, e che questo è un fatto necessario o fatto logico. Personalmente, ritengo che questa difficoltà può essere soddisfatta dalla teoria di Wittgenstein sulla tautologia, secondo la quale se una convinzione in p è incompatibile con quella di q che p e q non sono entrambe vere non è un fatto, ma una tautologia. Ma io non mi propongo di discutere di questo problema ulteriormente qui.

Dall’altra parte si sostiene che la logica formale o la logica di coerenza sia  l’insieme della logica e la logica induttiva  sia o un nonsenso o una parte delle scienze naturali. Questa asserzione, che suppongo che sia stata fatta da da Wittgenstein, sento più difficile da controbattere. Ma io credo che sarebbe un peccato, a causa del rispetto verso l’autorità, rinunciare a provare a dire qualcosa di utile sull’induzione.

Dobbiamo quindi tornare indietro alla concezione generale della logica come scienza del pensiero razionale. Noi troviamo che le parti più generalmente accettate della logica, vale a dire, la logica formale, la matematica e il calcolo delle probabilità, riguardano tutte semplicemente il garantire che le nostre convinzioni non siano auto-contraddittorie. Abbiamo posto davanti a noi stessi i criteri di coerenza e costruito queste elaborate regole per garantirne l’osservanza. Ma ovviamente questo non basta; vogliamo che le nostre convinzioni siano coerenti non solo l’una con l’altra ma anche con i fatti 1: né è ancora chiaro che la coerenza sia sempre vantaggiosa; ma potrebbe essere meglio essere a volte nel giusto che mai nel giusto. Né quando vogliamo essere coerenti siamo sempre in grado di esserlo: ci sono proposizioni matematiche la cui verità o falsità non può ancora essere decisa. Eppure si può umanamente parlando di avere diritto di prendere in considerazione un certo grado di convinzione in quelle per motivi induttivi o su altre basi: una logica che si propone di giustificare un tale grado di convinzione deve essere disposta in realtà  ad andare contro la logica formale; perché a una verità formale logica si può assegnare solo una convinzione di grado 1. Si potrebbe dimostrare nel sistema di Keynes che la sua probabilità è pari a 1 in qualsiasi prova. Questo punto mi sembra di dimostrare in modo particolarmente evidente che la logica umana o la logica della verità, che dice agli uomini come dovrebbero pensare, non è solo indipendente, ma a volte in realtà incompatibile con la logica formale.

1 Cfr.. Kant: ‘Denn obgleich eine Erkenntnis der logischen Form völlig gemäss sein möchte, dass ist sich selbst nicht widerspräche, so kann sie doch noch immer dem Gegenstande widersprechen.’ Kritik der reinen Vernunft, ‘, Prima Edizione p. 59. Infatti, sebbene la conoscenza della forma logica sia del tutto coerente cioè non contraria a sé, può tuttavia essere in disaccordo con l’oggetto ‘. Critica della ragion pura.

Nonostante questo quasi tutto il pensiero filosofico sulla logica umana e in particolare sull’induzione ha cercato di ridurlo in qualche modo alla logica formale. Non si suppone questo, se non da pochissimi, che la coerenza da sé stessa conduca alla verità; ma che alla coerenza con l’osservazione e la memoria spesso è attribuito questo potere.

Dal momento che un’osservazione ha cambiato (almeno in grado) la mia opinione sul fatto osservato, alcuni dei miei gradi di convinzione dopo l’osservazione sono necessariamente non coerenti con quelli che avevo prima. Dobbiamo quindi spiegare come esattamente l’osservazione potrebbe modificare i miei gradi di convinzione; ovviamente se p è il fatto osservato, il mio grado di convinzione in q dopo l’osservazione dovrebbe essere uguale al mio grado di convinzione in q dato p di prima, o dalla legge di moltiplicazione, al quoziente del mio grado di convinzione in pq per il mio grado di convinzione in p . Quando i miei gradi di convinzione cambiano in questo modo possiamo dire che essi sono stati modificati coerentemente con la mia osservazione.

Usando questa definizione, o nel sistema di Keynes semplicemente utilizzando la legge di moltiplicazione, possiamo prendere i miei attuali gradi di convinzione, e considerando la totalità delle mie osservazioni, scoprire da quali gradi iniziali di convinzione i miei attuali gradi di convinzione sarebbero sorti da questo processo di coerente modifica. I miei livelli attuali di convinzione possono quindi essere considerati logicamente giustificati se i corrispondenti gradi iniziali di convinzione sono logicamente giustificati. Ma il chiedere quali gradi iniziali di convinzione siamo giustificati, o nel sistema di Keynes quali sono le probabilità assolute a priori, mi sembra un problema senza senso; e anche se avesse un significato non vedo come potrebbe essere risolto.

Se abbiamo effettivamente applicato questo processo per un essere umano, scoperto, vale a dire, su quali probabilità a priori le sue opinioni attuali dovrebbero essere basate, dovremmo ovviamente trovarle tra quelle determinate da selezione naturale, con una generale tendenza a dare una maggiore probabilità alle alternative più semplici. Ma, come ho detto , non riesco a vedere quale potrebbe essere lo scopo di chiedersi se questi gradi di convinzione siano logicamente giustificati.

Ovviamente la cosa migliore sarebbe quella di sapere con certezza in anticipo che cosa sia vero e cosa falso, e quindi se un qualsiasi sistema di convinzioni iniziali dovesse ricevere l’approvazione del filosofo dovrebbe essere questo. Ma evidentemente questo non sarebbe accettato dai pensatori della scuola che sto criticando. Un’altra alternativa è quella di ripartire le probabilità iniziali sul sistema puramente formale esposto da Wittgenstein, ma come questo non fornisce alcuna giustificazione per l’induzione non può darci la logica umana che stiamo cercando.

Dobbiamo quindi cercare di avere un’idea di una logica umana che non deve tentare di essere riducibile alla logica formale. La logica, possiamo essere d’accordo, non riguarda ciò che gli uomini credono davvero, ma quello che dovrebbero credere, o quello che sarebbe ragionevole credere. Cosa significa allora, dobbiamo chiederci, dire che è ragionevole per un uomo avere questo o quel grado di convinzione in una proposizione? Prendiamo in considerazione le possibili alternative.

In primo luogo, questo significa a volte qualcosa di spiegabile in termini di logica formale: possiamo abbandonare questa possibilità per i motivi già spiegati. In secondo luogo, a volte significa semplicemente che essendo io al suo posto (e non ad esempio ubriaco) avrei avuto un tale grado di convinzione. In terzo luogo, a volte significa che se la sua mente lavora secondo certe regole, che possiamo approssimativamente chiamare ‘metodo scientifico’, avrebbe avuto un tale grado di convinzione. Ma in quarto luogo non è necessario sostenere nessuna di queste cose; perché gli uomini non hanno sempre creduto nel metodo scientifico, e proprio come noi domandiamo’ Ma io sono necessariamente ragionevole‘, possiamo anche chiedere ‘Ma è lo scienziato necessariamente ragionevole?’ In quest’ultimo significato mi sembra che possiamo identificare una ragionevole opinione con l’opinione di una persona ideale in circostanze analoghe. Quale, invece, sarebbe l’opinione di questa persona ideale ? Come è stato già osservato, il più alto ideale sarebbe sempre che avrebbe una opinione vera e sarebbe certo di ciò; ma questo ideale è più adatto a Dio che all’uomo.1

Dobbiamo dunque considerare la mente umana e ciò che è il massimo che possiamo chiedere ad essa. 2 La mente umana lavora essenzialmente in base a regole generali o abitudini; un processo mentale che non procede secondo qualche regola sarebbe semplicemente una sequenza casuale di idee; ogni volta che si deduce A da B lo facciamo in virtù di una qualche relazione tra di loro. Possiamo quindi affermare il problema dell’ideale come ” Quali abitudini in senso generale sarebbero le migliori che avesse la mente umana? ” Questo è un grande e indeterminato problema che difficilmente potrebbe essere risolto a meno che le possibilità fossero dapprima state limitate da una concezione abbastanza precisa della natura umana. Potremmo immaginare alcune abitudini molto utili diverse da quelle possedute da tutti gli uomini. [ Va precisato che io uso l’abitudine con il significato più ampio possibile per significare semplicemente regola o legge di comportamento, tra cui l’istinto: non voglio distinguere regole o abitudini acquisiti in senso stretto dalle regole innate o istinti, ma mi propongo di chiamarle tutte ugualmente abitudini.] Una analisi del tutto generale della mente umana è quindi destinata ad essere vaga e futile, ma qualcosa di utile si può dire se limitiamo l’argomento nel modo seguente.

Supponiamo di avere l’abitudine di formare un’opinione in un certo modo; ad esempio l’abitudine di derivare dall’opinione che un fungo è giallo l’opinione che sia velenoso. Allora possiamo accettare il fatto che la persona ha un’abitudine di questo genere, e chiedere semplicemente quale grado di parere che il fungo è velenoso sarebbe meglio per lui prendere in considerazione quando lo vede; cioè ammettendo che pensa sempre nello stesso modo su tutti i funghi gialli, possiamo chiedere quale sia il grado di fiducia migliore che lui dovrebbe avere che quei funghi siano velenosi. E la risposta è che sarà in generale migliore per il suo grado di convinzione che un fungo giallo è velenoso sia pari alla quota di funghi gialli che sono in realtà velenosi. (Ciò deriva dal significato del grado di convinzione.) Questa conclusione è necessariamente vaga per quanto riguarda l’area spazio-temporale dei funghi, che include, ma difficilmente più vaga della domanda a cui risponde. (Cfr. densità in un punto di gas composto da molecole.)

1[ Una precedente stesura della materia del paragrafo in qualche modo migliore. – F.P.R. Che cosa si intende dicendo che un certo grado di convinzione è ragionevole ? Primo e spesso che è quello che prenderei in considerazione se avessi i pareri della persona in questione al momento, ma erano diversi da come sono adesso, ad esempio, non ubriachi. Ma a volte andiamo oltre e chiediamo: ‘ Sono ragionevole?’ Questo può significare, mi comporto conformemente a determinate norme, enumerabili che noi chiamiamo metodo scientifico, e che stimiamo a causa del valore di chi lo pratica ed il successo che raggiunge. In questo senso essere ragionevoli significa pensare come uno scienziato, o essere guidato solo da raziocinio e induzione o qualcosa del genere (vale a dire mezzi ragionevoli di riflessione). In terzo luogo, possiamo andare alla radice del perché ammiriamo lo scienziato e analizziamo non un parere particolare primario, ma un abitudine mentale che conduce o meno alla scoperta della verità o prende in considerazione quei gradi di convinzione che sarebbero più utili. (Per includere le abitudini al dubbio o alla convinzione parziale). Allora possiamo considerare un parere secondo l’ abitudine che lo ha prodotto. Questo è chiaramente ragionevole, perché tutto dipende da questa abitudine; ma non sarebbe ragionevole ottenere la giusta conclusione di un sillogismo ricordando in modo impreciso che si lascia fuori un termine che è comune ad entrambe le premesse. Usiamo ragionevole nel senso 1 quando parliamo di un argomento di uno scienziato questo non mi sembra ragionevole; nel senso 2 quando confrontiamo la ragione e superstizione o istinto; nel senso 3 quando si valuta il valore dei nuovi metodi di pensiero come la divinazione.]

2 Quello che segue fino alla fine della sezione è quasi interamente basato sugli scritti di C.S. Peirce . [Soprattutto le sue ” illustrazioni della Logica della scienza “, Popular Science Monthly 1877 e 1878 , ristampato in Chance Love and Logic ( 1923).]

Mettiamola in un altro modo: ogni volta che faccio una deduzione, la faccio in base a qualche regola o abitudine. Un’inferenza non è completamente data quando ci è data la premessa e la conclusione; deve essere data anche la relazione fra esse in virtù della quale viene realizzata la deduzione. La mente funziona per leggi generali; quindi se deduce q da p , questo sarà generalmente perché q è un caso di una funzione φx e p il corrispondente caso di una funzione ψx tale che la mente sempre dedurrà φx da ψx . Quando quindi non analizziamo le opinioni, ma i processi attraverso cui sono nate, la regola della deduzione determina per noi un intervallo a cui la teoria della frequenza può essere applicata. La regola di deduzione può essere ristretta, come quando vedendo un fulmine mi aspetto il tuono, o larga , come quando si considerano 99 casi di una generalizzazione che ho osservato per essere vera concludo che il centesimo anche è vero. Nel primo caso, l’abitudine che determina il processo è ‘ Dopo il lampo si aspetta il tuono ‘; il grado di affidamento che sarebbe il migliore per questa abitudine da esprimere è pari al rapporto tra i casi di lampi che siano effettivamente seguiti da tuoni. Nel secondo caso l’abitudine è quella più generale di inferire da 99 casi osservati un certo tipo di generalizzazione che il centesimo è anche vero; il grado di convinzione che sarebbe meglio per questa abitudine da esprimere è uguale alla proporzione di tutti i casi dei 99 esempi di una generalizzazione che è vera, in cui anche il centesimo è vero.

Così dato un unico parere , possiamo solo lodarlo o biasimarlo sulla base della verità o della falsità: data l’abitudine ad una certa forma, possiamo lodarlo o biasimarlo di conseguenza a seconda che il grado di convinzione che produce sia vicino o lontano dalla reale proporzione in cui l’abitudine conduce alla verità. Possiamo allora lodare o biasimare opinioni in forma derivata dalla nostra lode o biasimo delle abitudini che li producono.

Questa relazione può essere applicata non solo alle abitudini di deduzione, ma anche alle abitudini di osservazione e alla memoria; quando abbiamo una certa sensazione in relazione con un’immagine pensiamo che l’ immagine rappresenti qualcosa che in realtà è successo a noi, ma non possiamo esserne sicuri; il grado di diretta fiducia nella nostra memoria varia. Se ci chiediamo qual è il miglior grado di fiducia che possiamo riporre in una sicura specifica sensazione di memoria, la risposta deve dipendere da quanto spesso, quando questo sentimento si verifica l’evento a cui l’immagine si collega si è veramente verificato.

Tra le abitudini della mente umana una posizione di particolare importanza è occupata dall’induzione. Fin dai tempi di Hume molto è stato scritto circa la giustificazione dell’inferenza induttiva. Hume ha mostrato che non poteva essere ridotta a inferenza deduttiva o giustificata dalla logica formale. Nel modo in cui si sviluppa la sua dimostrazione mi sembra definitiva; e il suggerimento di Keynes che può essere aggirata per quanto riguarda l’induzione come una forma di inferenza probabile, non può a mio avviso essere accettato. Ma supporre che la situazione che ne deriva sia uno scandalo per la filosofia è, a mio avviso, un errore.

Siamo tutti convinti per ragionamenti induttivi, e la nostra convinzione è ragionevole, perché il mondo è così costituito che gli argomenti induttivi conducono tutto sommato a pareri veri. Non siamo, pertanto, in grado di avere fiducia nell’induzione, né se potessimo aiutarla non vedremmo alcuna ragione per cui dovremmo, perché noi crediamo che sia un processo affidabile. E vero che che se qualcuno non ha l’abitudine nell’induzione, non potremmo dimostrargli che sbaglia; ma non c’è nulla di particolare in questo. Se un uomo dubita della propria memoria o della sua percezione non possiamo dimostrargli che sono affidabili; il chiedere per questo una cosa che lo provi è piangere per la luna, e lo stesso vale per l’induzione. E’ una delle principali fonti di conoscenza così come lo è la memoria: nessuno considera uno scandalo per la filosofia che non c’è la prova che il mondo non sia cominciato due minuti fa e che tutti i nostri ricordi non siano illusori.

Siamo tutti d’accordo che un uomo che non ha fatto induzioni sarebbe non razionale: il problema è solo ciò che questo significa. A mio parere ciò non significa che l’uomo peccherebbe contro la logica formale o la probabilità formale; ma che non avrebbe acquisito un’abitudine molto utile, senza la quale starebbe molto peggio, nel senso di essere molto meno probabile 1 che abbia opinioni vere.

Si tratta di una sorta di pragmatismo: noi giudichiamo le abitudini mentali a seconda se funzionano, cioè se le opinioni che inducono siano per la maggior parte vere, o più spesso vere di quelle che differenti abitudini indurrebbero.

L’induzione è una abitudine utile, e ad adottarla è ragionevole. Tutto ciò che la filosofia può fare è di analizzarla, determinare il grado della sua utilità, e trovare da quali caratteristiche della natura, questa dipenda. Un mezzo indispensabile per indagare questi problemi è l’induzione stessa, senza la quale saremmo impotenti. In questa circolarità non si si trova nessun circolo vizioso. E’ solo attraverso la memoria che possiamo determinare il grado di accuratezza della memoria; perché se facciamo esperimenti per determinare questo effetto, essi saranno inutili se non li ricordassimo.

Si consideri, alla luce della discussione precedente quale tipo di soggetto sia induttivo o di logica umana – la logica della verità. La sua attività è quella di prendere in considerazione i metodi di pensare, e scoprire che misura di fiducia si debba riporre in questi, vale a dire in quale proporzione di esperienze essi conducono alla verità. In questa analisi essa può solo essere distinta dalle scienze naturali per la maggiore generalità dei suoi problemi. Si deve considerare la relativa validità dei diversi tipi di procedure scientifiche, come ad esempio la ricerca di una legge causale con i Metodi Mill, ed i moderni metodi matematici come il ragionamento a priori usato nella scoperta della Teoria della Relatività. Il progetto corretto di tale soggetto si può trovare in Mill 1, io non intendo i dettagli dei suoi Metodi o anche l’uso della Legge di Causalità. Ma il suo modo di trattare l’argomento come un corpo di induzioni riguardante induzioni, la Legge di Causalità che governa meno le leggi essendo essa stessa dimostrata per induzione per semplice enumerazione. I diversi metodi scientifici che possono essere utilizzati sono in ultima istanza valutati per induzione per semplice enumerazione; abbiamo scelto la più semplice legge che si adatta ai fatti, ma se non scopriamo che leggi così ottenute si adattano anche a fatti differenti da quelli per cui erano state realizzate per adattarsi, dobbiamo scartare questa procedura per qualche altra.

1 ‘probabile’ qui significa semplicemente che io non sono sicuro di questo, ma ho solo un certo grado di convinzione in esso.

 Cfr.. anche la relazione sulle ‘General rules’ nel capitolo ‘Of Unphilosophical Probability’ nel Trattato di Hume.

Facts and Propositions – Da The Foundation of Mathematics di Frank P. Ramsey

7 Giu

Schermata 2013-12-04 alle 16.16.05Propongo la mia traduzione della sesta parte delle opere pubblicate di Frank Plumpton Ramsey  raccolte da R. B. Braithwaite sotto il titolo The Foundation of Mathematics.

Questa sezione è particolarmente importante perché tratta il tema del “significato” e delle relazioni proposizionali condividendo larga parte delle teorie di Wittgenstein come espresse nel Tractatus.

VI

Fatti e Proposizioni (1927)

Il problema che mi propongo di trattare è l’analisi logica di ciò che può essere chiamato attraverso qualsiasi dei termini giudizio, convinzione, o asserzione. Supponiamo che io stia in questo momento esprimendo il giudizio che Cesare è stato assassinato: allora è naturale distinguere in questo fatto, da un lato o la mia mente, o il mio attuale stato mentale, o le parole o le immagini nella mia mente, che chiameremo il fattore mentale o i fattori mentali, e dall’altro lato o Cesare, o l’omicidio di Cesare, o Cesare e l’omicidio, o la proposizione che Cesare fu assassinato, o il fatto che Cesare è stato assassinato, che chiameremo il fattore oggettivo o fattori oggettivi; e il supporre che il fatto su cui sto esprimendo un giudizio che Cesare è stato assassinato si accorda con il possedere qualche relazione o le relazioni tra questi fattori mentali e i fattori oggettivi. Le domande che sorgono sono per quanto riguarda la natura dei due gruppi di fattori e dei rapporti tra di loro, essendo la distinzione fondamentale tra questi elementi difficilmente discutibile.

Cominciamo con il fattore oggettivo o fattori oggettivi; il punto di vista più semplice è che ci sia uno solo di tali fattori, una proposizione, che può essere vera o falsa, essendo la verità e la falsità attributi non analizzabili. Questo era un tempo il punto di vista di Russell, e nel suo saggio ” Sulla natura della Verità e del Falso ” 1 , spiega le ragioni che lo hanno spinto ad abbandonarla. Questi erano, in sintesi, l’impossibilità di credere nell’esistenza di certi oggetti come ‘ che Cesare è morto nel suo letto ‘, che potrebbero essere descritti come falsità oggettive, e la misteriosa natura della differenza, in questa teoria , tra verità e falsità. Ha quindi concluso, a mio parere giustamente, che un giudizio non ha un singolo oggetto, ma è una relazione multipla della mente o di fattori mentali su molti oggetti, quelli, cioè, che chiameremmo ordinariamente costituenti della proposizione valutata.

1 In Philosophical Essays, 1910.

Vi è, tuttavia, un modo alternativo di ritenere che una giudizio abbia un unico oggetto, che sarebbe bene prendere in considerazione prima di passare oltre. Nel saggio summenzionato Russell afferma che una percezione, che a differenza di un giudizio egli considera infallibile, ha un unico oggetto, ad esempio, l’ oggetto complesso ‘ coltello-a-sinistra-del-libro ‘. Questo oggetto complesso può, credo, essere identificato con quello che molte persone (e Russell ora) avrebbe chiamato il fatto che il coltello è a sinistra del libro; potremmo, per esempio, dire che abbiamo percepito questo fatto. E proprio come se noi prendiamo una qualsiasi proposizione vera come quella di Cesare che non è morto nel suo letto, possiamo formare una corrispondente frase che inizia con ‘il fatto che ‘ e ​​parlare del fatto che non è morto nel suo letto, così Russell suppose che ad ogni proposizione vera non corrispondesse un oggetto complesso.

Russell, quindi, riteneva che l’oggetto di una percezione era un fatto, ma che nel caso di un giudizio la possibilità di errore rendesse questo punto di vista insostenibile, dal momento che l’oggetto di un giudizio che Cesare è morto nel suo letto non poteva essere il fatto che è morto nel suo letto, dal momento che non esisteva un tale fatto. È tuttavia evidente che tale difficoltà sull’errore potrebbe essere rimossa postulando per il caso di un giudizio due relazioni differenti tra i fattori mentali e il fatto, una che si presenta per i giudizi veri, l’altra in quelli falsi. Così, un giudizio che Cesare fu assassinato e un giudizio che Cesare non fu assassinato avrebbero lo stesso oggetto, il fatto che Cesare è stato assassinato, ma differiscono per quanto riguarda i rapporti tra il fattore mentale e questo oggetto. Così, in The Analysis of Mind 1 Russell parla di convinzione sia come verso sia contro i fatti. Mi sembra, tuttavia, che tale punto di vista  o di giudizio o di percezione sarebbe inadeguato per un motivo che, se valido, è di grande importanza. Prendiamo per semplicità il caso della percezione e, assumendo per amor di discussione che sia infallibile, consideriamo se ‘ Egli percepisce che il coltello è a sinistra del libro’ può davvero asserire una relazione biunivoca tra una persona e un fatto. Supponiamo che io che faccio l’affermazione non possa io stesso vedere il coltello e il libro, che il coltello sia realmente alla destra del libro, ma che, attraverso qualche errore suppongo che si trovi a sinistra e che egli percepisca essere a sinistra, in modo che io affermo erroneamente ‘ Egli percepisce che il coltello è a sinistra del libro’. Allora la mia affermazione, anche se falsa, è significativa, e ha lo stesso significato che avrebbe se fosse vera; questo significato non può quindi essere che ci sia una relazione biunivoca tra la persona e qualcosa (un fatto) di cui ‘ che il coltello è a fianco del libro ‘ è il nome, perché non esiste nulla di simile. La situazione è la stessa come con le descrizioni; ‘ Il re di Francia è saggio ‘ non è un nonsenso, e così ‘ il re di Francia ‘, come Russell ha dimostrato, non è un nome, ma un simbolo incompleto, e lo stesso deve essere vero del ‘ re d’Italia ‘. 2 Così anche ‘ che il coltello è a sinistra del libro ‘ se sia vero o falso, non può essere il nome di un fatto.

1 p. 272. Va osservato che, in The Analysis of Mind una ‘ convinzione ‘ è ciò che chiamiamo un fattore mentale, non l’intero complesso di fattori mentali e delle relazioni e dei fattori oggettivi.

2 N.d.t. Occorre tenere presente che nel 1927 l’Italia aveva un re.

Ma, si potrebbe chiedere, perché non dovrebbe essere una descrizione di un fatto? Se dico ‘ Egli percepisce che il coltello è a sinistra del libro ‘, intendo che lui percepisce un fatto che non viene nominato, ma descritto come di un certo tipo, e la difficoltà scompare quando la mia affermazione viene analizzata secondo la teoria di Russell delle descrizioni. Allo stesso modo, si dirà, ‘ la morte di Cesare ‘ è una descrizione di un evento, e ‘ il fatto che Cesare è morto ‘ è solo un’espressione alternativa per ‘ la morte di Cesare ‘.

Una tale obiezione è plausibile, ma non è, a mio parere, valida.

La verità è che una frase come ‘ la morte di Cesare ‘ può essere utilizzata in due modi diversi; di solito, la usiamo come la descrizione di un evento, e potremmo dire che ‘ la morte di Cesare ‘ e ‘ l’assassinio di Cesare ‘ siano due diverse descrizioni dello stesso evento. Ma possiamo anche usare ‘ la morte di Cesare ‘ in un contesto come ‘ Era consapevole della morte di Cesare ‘ che significa ‘ Egli era consapevole del fatto che Cesare era morto ‘: qui (e questo è il tipo di caso che si verifica nella discussione sulla cognizione), non possiamo considerare ‘ la morte di Cesare ‘, come la descrizione di un evento; se così fosse, l’intera proposizione sarebbe ‘ C’è un evento E di un certo tipo tale che egli è consapevole di E ‘, e che sarebbe ancora vero se avessimo sostituito un’altra descrizione dello stesso evento, ad esempio, ‘ l’assassinio di Cesare ‘. Cioè, se la sua consapevolezza ha per oggetto un evento descritto da ‘ la morte di Cesare ‘, allora , se è a conoscenza della morte di Cesare, deve anche essere a conoscenza dell’assassinio di Cesare, perché sono identici. Ma, in realtà, poteva benissimo essere consapevole del fatto che Cesare era morto senza sapere che era stato ucciso, in modo che la sua consapevolezza deve avere per oggetto non solo un evento, ma un evento e anche una qualità.

Il collegamento tra l’evento che è stato la morte di Cesare e il fatto che Cesare è morto è, a mio parere, questo: ‘ che Cesare è morto ‘ è davvero una proposizione esistenziale, asserendo l’esistenza di un evento di un certo tipo, somigliando così a ‘ l’Italia ha un Re ‘, che afferma l’esistenza di un uomo di un certo tipo. L’evento, che è di questo tipo si chiama la morte di Cesare, e non sarebbe più confuso con il fatto che Cesare è morto di quanto che il Re d’ Italia sia confuso con il fatto che l’Italia ha un re.

Abbiamo visto, quindi, che una frase che inizia ‘ il fatto che ‘ non non è un nome, ma anche che non è una descrizione; è , dunque, né un nome né una descrizione di qualsiasi componente effettivo di una proposizione, e così una proposizione ‘ il fatto che aRb ‘ deve essere analizzata nella (1) proposizione aRb, (2) qualche ulteriore proposizione intorno ad a, R, b, e altri oggetti; e un’analisi della cognizione in termini di relazioni con i fatti non può essere accettato come definitiva. Siamo spinti, quindi, alla conclusione di Russell che un giudizio 1 non ha un oggetto, ma molti oggetti, a cui il fattore mentale è correlato in modo multiplo; ma il lasciare le cose come stanno, come ha fatto, non può essere considerato soddisfacente. Non c’è ragione di supporre la relazione multipla semplice; essa può, per esempio, derivare dalla combinazione di relazioni duali tra parti del fattore mentale e gli oggetti separati; ed è auspicabile che dovremmo trovare qualcosa di più su questa, e come varia quando viene variata la forma di proposizione assunta. Allo stesso modo, una teoria delle descrizioni che si soddisfi nell’osservare che ‘ Il re di Francia è saggio ‘ potrebbe essere considerata come affermare un possibile rapporto multiplo tra la regalità, la Francia, e la saggezza, sarebbe miseramente inferiore alla teoria di Russell, che spiega esattamente di che relazione si tratta.

1 E , a nostro avviso, è il caso di qualsiasi altra forma di conoscenza o opinione che qualcosa…

Ma prima di procedere ulteriormente con l’ analisi del giudizio, è necessario dire qualcosa su verità e falsità, al fine di dimostrare che non c’è davvero alcun problema distinto di verità, ma solo una confusione linguistica. Verità e falsità sono attribuiti principalmente alle proposizioni. La proposizione a cui sono attribuite può essere sia esplicitamente data o descritta. Supponiamo dapprima che sia esplicitamente data; quindi è evidente che ‘ E’ vero che Cesare è stato assassinato ‘ significa non più di che Cesare è stato assassinato, e ‘ È falso che Cesare è stato assassinato ‘ significa che Cesare non è stato assassinato. Queste sono frasi che a volte usiamo per enfasi o per ragioni stilistiche, o per indicare la posizione occupata dalla asserzione nel nostro ragionamento. Così anche noi possiamo dire ‘ E’ un fatto che è stato assassinato ‘o’ che sia stato ucciso è contrario alla realtà ‘. Nel secondo caso in cui la proposizione è descritta e non data esplicitamente abbiamo forse più di un problema, perché noi otteniamo dichiarazioni da cui non possiamo nel linguaggio ordinario eliminare la parola ‘ vero ‘ e ‘ falso ‘. Quindi se dico ‘ Lui ha sempre ragione ‘, voglio dire che le proposizioni che egli afferma sono sempre vere, e non ci sembra che esista un modo di esprimere questo senza usare la parola ‘ vero ‘. Ma supponiamo che lo abbiamo messo così ‘ per ogni p, se egli afferma p, p è vera ‘, allora vediamo che la funzione proposizionale p è vera, è semplicemente la stessa p, come ad esempio il suo valore ‘Cesare fu assassinato è vero ‘ è lo stesso di ‘ Cesare è stato assassinato ‘. Abbiamo in inglese da aggiungere ‘ è vero ‘ per dare alla frase un verbo, dimenticando che ‘p’ contiene già un (variabile) verbo. Questo può forse essere reso più chiaro supponendo per un momento che sia in esame una sola forma di proposizione, diciamo la forma relazionale aRb; allora ‘ Lui ha sempre ragione ‘ potrebbe essere espressa da ‘ Per tutti gli a, R, b, se egli afferma aRb , allora aRb ‘, a cui ‘ è vero ‘ sarebbe un’aggiunta ovviamente superflua. Quando tutte le forme di proposizione sono incluse l’analisi è più complicata ma non sostanzialmente differente; ed è evidente che il problema non è tanto la natura del vero e del falso, ma sulla natura del giudizio o affermazione, perché ciò che è difficile analizzare nella formulazione di cui sopra è ‘ Egli afferma aRb ‘.

E’, forse, anche immediatamente evidente che se abbiamo analizzato il giudizio noi abbiamo risolto il problema della verità; perché prendendo il fattore mentale in un giudizio (che spesso viene esso stesso chiamato giudizio), la verità o la falsità di questo dipende solo da quale proposizione viene giudicata, e ciò che dobbiamo spiegare è il significato nel dire che il giudizio è un giudizio che a ha R con b, cioè è vero se aRb, falso nel caso contrario. Possiamo, se vogliamo, dire che è vero se esiste un fatto corrispondente che a ha R con b, ma questo non è essenzialmente un’analisi, ma una perifrasi, perché ‘ Il fatto che a  ha R con b esiste ‘ non è diverso da ‘ a ha R con b ‘.

Al fine di andare avanti, dobbiamo ora considerare i fattori mentali in una convinzione. La loro natura dipenderà dal significato in cui stiamo usando il termine ambiguo convinzione: è, ad esempio, possibile dire che un pollo crede che un certo tipo di bruco sia velenoso, e intendere con questo semplicemente che si astiene dal mangiare tali bruchi a causa di spiacevoli esperienze ad essi collegate. I fattori mentali in una tale convinzione sarebbero parti del comportamento del pollo, che sono in qualche modo legati a fattori oggettivi, vale a dire il tipo di bruco e la velenosità. Un’analisi esatta di questa relazione sarebbe molto difficile, ma potrebbe anche essere meglio considerato che in relazione a questo tipo di convinzione il punto di vista pragmatico è corretto, cioè che la relazione tra il comportamento del pollo e i fattori oggettivi era che le azioni erano tali da risultare utili se, e solo se, i bruchi erano in realtà velenosi. Pertanto, qualsiasi insieme di azioni per cui l’utilità p è una condizione necessaria e sufficiente potrebbe essere chiamato una convinzione che p, e così sarebbe vera se p, cioè se fosse utile 1.

1 E ‘utile pensare che aRb vorrebbe dire che è utile per fare le cose che sono utili se, e solo se, aRb; che è evidentemente equivalente a aRb.

Ma senza voler svalutare l’importanza di questo tipo di convinzione, non è quello che voglio discutere qui. Io preferisco trattare con quelle convinzioni che si esprimono in parole, o anche in immagini o con altri simboli, consapevolmente affermate o negate; perché queste convinzioni, a mio avviso, sono il soggetto più adatto per una critica logica.

Io assumo essere le parole i fattori mentali di una tale convinzione, pronunciate ad alta voce o tra sé e sé o semplicemente immaginate, collegate tra loro e accompagnate da una sensazione o sensazione di credere o sensazione di non credere, a essa collegata in un modo che non mi propongo di discutere. 2 Io suppongo per semplicità che il pensatore di cui ci stiamo occupando usa un linguaggio sistematico, senza irregolarità e con una notazione logica esatta come quella dei Principia Matematica. I segni principali in tale linguaggio possono essere suddivisi in nomi logici, costanti logiche e variabili. Cominciamo con nomi, ogni nome rappresenta un oggetto, che significa che esiste una relazione biunivoca tra questi. Evidentemente il nome, il significato, la relazione, e l’oggetto possono essere davvero tutti complessi, in modo che il fatto che il nome significa l’oggetto non è in definitiva nella forma relazionale biunivoca ma molto più complicata.1 Tuttavia, proprio come nello studio degli scacchi non si guadagna nulla nel discutere sugli atomi di cui i pezzi degli scacchi sono costituiti, così nello studio della logica non si guadagna nulla entrando nell’analisi fondamentale dei nomi e degli oggetti che li rappresentano. Questi costituiscono gli elementi delle convinzioni del pensatore in base alle quali le varie relazioni logiche fra una convinzione e l’altra possono essere definite, mentre la loro costituzione interna è irrilevante.

2 Parlo in tutto e per tutto come se le differenze tra convinzione, non convinzione, e mera considerazione si trovino in presenza o assenza di ‘ sensazioni ‘; ma qualsiasi altra parola può essere sostituita a ‘ sensazione ‘ che il lettore preferisce, ad esempio, ‘ specifica qualità ‘ o ‘ atto di affermazione ‘ e ‘ atto di negazione ‘.

1 Questo è più evidente nel caso di nomi, che generalmente consistono di lettere, in modo che la loro complessità è evidente.

Per mezzo dei nomi solo chi pensa può formare quelle che potremmo chiamare frasi atomiche, che dal nostro punto di vista formale, non offrono un problema molto serio. Se a , R , e b sono oggetti che sono semplici in relazione al suo linguaggio, cioè delle tipologie di esempi di cui egli possiede nomi, egli crederà che aRb avendo i nomi per a, R, e b connessi nella sua mente e accompagnati da un sentimento di convinzione. Questa affermazione, tuttavia, è troppo semplice, dal momento che i nomi devono essere uniti in un modo appropriato ad aRb piuttosto che a bRa; ciò può essere spiegato dicendo che il nome di R non è la parola ‘ R ‘, ma la relazione che costruiamo tra ‘a’ e ‘b’ scrivendo ‘ aRb ‘. Il senso in cui questa relazione unisce ‘a’ e ‘ b ‘, quindi determina se si tratta di una convinzione che aRb o che bRa. Ci sono varie altre difficoltà dello stesso tipo, ma mi propongono di passare ai problemi più interessanti che sorgono quando consideriamo le più complicate convinzioni che richiedono per la loro espressione non solo i nomi, ma anche costanti logiche, così che dobbiamo spiegare la modalità di significato di parole come ‘non’ e ‘o’ .

Una possibile spiegazione 1 è che esse, o alcune di esse, ad esempio ‘non’ e ‘e’ in base a cui gli altri possono essere definiti, sono nomi di relazioni, in modo che le frasi in cui si presentano sono simili a quelle atomiche, tranne che per le relazioni che essi affermano che sono logiche invece che materiali. Da questo punto di vista ogni proposizione è definitivamente affermativa, affermando una semplice relazione tra termini semplici, o un semplice qualità di un termine semplice. Così, ‘Questo è non – rosso ‘ afferma un rapporto della negazione tra questo e il rosso, e ‘Questo non è non – rosso’ un altra relazione di negazione tra questo, il rosso e la prima relazione della negazione.

1 Cfr., in particolare , J.A. Chadwick, ” Logical Constants “. Mind, 1927.

Questo punto di vista richiede un atteggiamento così diverso dalla logica da parte mia che è difficile per me trovare una base comune da cui partire per discuterne. Ci sono, tuttavia, una o due cose che vorrei dire nella critica: in primo luogo, che trovo molto insoddisfacente che sia lasciato senza alcuna spiegazione di logica formale, tranne che si tratta di una raccolta di ‘fatti necessari’. La conclusione di una inferenza formale deve, mi pare, essere in un certo senso contenuta nelle premesse e non qualcosa di nuovo; io non posso credere che da un fatto, ad esempio, che una cosa è rossa, possa essere possibile dedurre un numero infinito di fatti diversi, ad esempio che questo non è non rosso, e che è sia insieme rosso e non non – rosso. Questi, dovrei dire, sono semplicemente lo stesso fatto espressi in altre parole; né è inevitabile che ci dovrebbero essere tutti questi modi diversi di dire la stessa cosa. Potremmo, per esempio, esprimere la negazione non inserendo una parola ‘ non ‘, ma scrivendo ciò che neghiamo a testa in giù. Tale simbolismo è solo scomodo perché non siamo abituati a percepire una simmetria complicata attorno ad un asse orizzontale, ma se l’avessimo adottata ci saremmo liberati del ridondante ‘non – non ‘, con il risultato che negare la frase ‘p’ per due volte sarebbe semplicemente la frase ‘p’ stessa.

Mi sembra, quindi, che ‘ non ‘ non può essere un nome (perché, se lo fosse, ‘ non – non – p ‘ dovrebbe essere circa l’oggetto non e così diverso nel significato da ‘ p ‘), ma deve funzionare in un modo radicalmente diverso. Ne consegue che dobbiamo permettere alle negazioni e alle  disgiunzioni di essere in ultima analisi diverse dalle affermazioni positive e non solo le affermazioni di relazioni diverse ma ugualmente positive. Dobbiamo, quindi, abbandonare l’idea che ogni proposizione asserisce una relazione tra termini, un’idea che sembra difficile da scartare come la più vecchia che una proposizione asserisce sempre un predicato di un soggetto.

Supponiamo che il nostro pensatore stia prendendo in considerazione una sola frase atomica, e che il progresso della sua meditazione conduca sia al suo crederla o non crederla. Questo può essere supposto che consista inizialmente in due diverse sensazioni legate alla frase atomica, e in tale relazione mutuamente esclusiva; la differenza tra affermazione e negazione è quindi formato da una differenza di sensazione e non nell’assenza o nella presenza di una parola come ‘ non ‘. Tale parola, tuttavia, sarà abbastanza indispensabile ai fini della comunicazione, essendo la convinzione nella frase atomica comunicata pronunciandola ad alta voce, il non credere con il pronunciare insieme a questa la parola ‘ non ‘. Con una sorta di associazione questa parola entrerà a far parte del linguaggio interno del nostro pensatore, e invece di sentire la non convinzione verso ‘ p ‘ lui a volte sentirà la convinzione verso ‘ non – p’.

Se questo accade, possiamo dire che non credere ‘p’ e credere ‘ non -p ‘ sono eventi equivalenti, ma il determinare cosa si intende con questo ‘ equivalente ‘ è, a mio avviso, la difficoltà centrale del soggetto. La difficoltà esiste in qualsiasi teoria, ma è particolarmente importante nella mia, che sostiene che il significato di ‘non’ non consiste in una relazione di significato di un oggetto, ma in questa equivalenza tra non credere ‘p’ e credere ‘ non – p ‘ .

Mi sembra che l’equivalenza tra credere ‘ non – p ‘ e non credere ‘ p ‘ deve essere definita in termini di causalità, avendo i due esempi in comune molte delle loro cause e molti dei loro effetti. Ci sarebbero molte occasioni in cui ci dovremmo aspettarci che l’una o l’altra possa prodursi, ma non so quale, e qualsiasi avvenga dovremmo aspettarci lo stesso tipo di comportamento di conseguenza. L’essere equivalenti, potremmo dire, è l’avere in comune alcune proprietà causali, che vorrei poter definire con maggiore precisione. Chiaramente non sono affatto semplici; non c’è un’azione uniforme che nel credere ‘p’ si verificherà sempre. Potrebbe non indurre a nessuna azione del tutto, tranne che in circostanze particolari, in modo che le sue proprietà causali esclusivamente esprimeranno quegli effetti che risultino quando sono soddisfatte alcune altre condizioni. E, ancora, solo alcuni tipi di cause ed effetti devono essere ammessi; per esempio , non siamo interessati ai fattori che determinano, ed i risultati determinati da, il ritmo delle parole.

Sentire convinzione verso le parole ‘ non – p ‘ e sentire incredulità verso le parole ‘ p’ hanno allora in comune alcune proprietà causali. Mi propongo di esprimere questo fatto dicendo che i due casi esprimono lo stesso atteggiamento, l’atteggiamento di non credere p o credere non – p. D’altra parte, sentire la convinzione verso ‘p ‘ ha differenti proprietà causali, e quindi esprime un atteggiamento diverso, l’atteggiamento di credere p. E’ evidente che l’importanza delle convinzioni e non convincimento risiede non nella loro natura intrinseca, ma nelle loro proprietà causali, cioè le loro cause e soprattutto i loro effetti. E perché dovrei avere una sensazione di convinzione verso i nomi ‘a’ , ‘ R ‘ e ‘b’ , quando aRb, e di non credere quando non – aRb, tranne perché gli effetti di queste sensazioni sono spesso più soddisfacenti di quelli alternativi a questi.

Se allora io dico di qualcuno di cui non conosco lingua ‘Egli crede che non – aRb ‘, voglio dire che sta accadendo nella sua mente una certa combinazione di una sensazione e parole tali da esprimere l’atteggiamento di credere non – aRb, cioè ha alcune proprietà causali, che possono in questo semplice caso 1, essere specificati come quelle che appartengono alla combinazione di una sensazione di incredulità e i nomi per a, R, e b, o, nel caso di chi utilizza la lingua inglese, alla combinazione di una sensazione di convinzione, per i nomi a, R , e b , e per un numero dispari di ‘ non’. Oltre a questo , si può dire che le proprietà causali sono collegate con a, R, e b in modo tale che le uniche cose che le possono avere devono essere composte dai nomi di a, R, e b. (Questa è la dottrina che il significato di una frase deve risultare dal significato delle parole in essa contenute).

1 Nei casi più complicati trattati più avanti una descrizione simile mi sembra impossibile se non con riferimento ad una lingua particolare. Ci sono modi in cui questo può apparentemente essere fatto, ma penso che siano illusori.

Quando abbiamo a che fare con una sola proposizione atomica, siamo abituati ad abbandonare la teoria della probabilità degli atteggiamenti intermedi della convinzione parziale, e a considerare solo gli estremi della piena convinzione e piena non convinzione. Ma quando il nostro pensatore si occupa di diverse proposizioni atomiche insieme, la questione è più complicata, perché abbiamo a che fare non solo con atteggiamenti completamente definiti, come credere p e non credere q, ma anche con atteggiamenti relativamente indefiniti, come credere che sia vero p o q, senza sapere quale. Tale atteggiamento può, tuttavia, essere definito in termini di possibilità di verità delle proposizioni atomiche, con le quali concorda e non concorda. Quindi , se abbiamo n proposizioni atomiche, per quanto riguarda la loro verità e falsità ci saranno 2n possibilità reciprocamente esclusive, e un possibile atteggiamento è determinato dall’assumere un qualsiasi insieme di queste e dire che è una di questa serie che è, in effetti, verificata, non una delle rimanenti. Così, il credere p o q è l’esprimere un accordo con le possibilità p vera e q vero, p falso e q vero, p vero e q falso, e il disaccordo con la restante possibilità p falso e q falso. Il dire che la sensazione di convinzione verso una frase esprime un atteggiamento del genere equivale a dire che ha alcune proprietà causali che variano con l’atteggiamento, ovvero quali possibilità vengono eliminate e quali, per così dire, vengono invece lasciate. Molto approssimativamente il pensatore agirà in disaccordo con le possibilità respinte, ma non so come spiegare questo con precisione.

In qualsiasi linguaggio comune un simile atteggiamento può essere espresso con una sensazione di convinzione nei confronti di una frase complessa costituita dalle frasi atomiche per mezzo di congiunzioni logiche; quale atteggiamento esso sia, dipenderebbe non dalla sensazione ma dalla forma della frase. Possiamo quindi dire in modo ellittico che la frase esprime l’atteggiamento, e che il significato di una frase è un accordo e un disaccordo con tali e tali altre possibilità di verità, intendendo con ciò che uno che afferma o crede in una frase così è d’accordo e in disaccordo.

Nella maggior parte delle notazioni logiche il significato della frase è determinata da segni di operazione logici che si presentano in essa, come ‘ non ‘ e ‘e’. Questo ha significato nel modo seguente: ‘ non – p ‘ , sia che ‘p’ sia una proposizione atomica o no, esprime un accordo con le possibilità con cui ‘p’ esprime un disaccordo e viceversa. ‘ p e q ‘ esprimono accordo con una certa possibilità che sia ‘ p ‘ sia ‘ q ‘ esprimano accordo tra loro, e disaccordo con tutte le altre. Con queste regole il significato di ogni frase costruito da frasi atomiche per mezzo di ‘non’ e ‘e’ è completamente determinato, il significato di ‘ non ‘ essendo così definito  come una legge che determina l’atteggiamento espresso da ‘ non-p ‘ nei termini di quello espresso da ‘ p ‘.

Questo potrebbe, naturalmente, essere utilizzato solo come definizione di ‘ non ‘ in un simbolismo basato direttamente sulle possibilità di verità. Così nella notazione spiegata a pagina 95 del  Tractatus logico-philosophicus  di Wittgenstein, potremmo definire ‘ non-P ‘ come il simbolo ottenuto scambiando la T e gli spazi nell’ultima colonna di ‘ p ‘. Di solito, però, usiamo sempre un diverso tipo di simbolismo in cui ‘ non ‘ è un segno primitivo che non può essere definito senza circolarità; ma anche in questo simbolismo possiamo chiederci come ‘ ” nicht ” che significa non’ sarebbe da analizzare, ed è questo problema a cui le osservazioni di cui sopra sono destinate a rispondere. Nel nostro simbolismo ordinario le possibilità di verità sono più convenientemente espresse come congiunzioni di proposizioni atomiche e le loro negazioni, e qualsiasi proposizione sarà esprimibile come una disgiunzione delle possibilità di verità con cui concorda.

Se applichiamo le operazioni logiche alle frasi atomiche in modo indiscriminato, noi a volte otterremo frasi composite che non esprimono nessun atteggiamento di convinzione. Così ‘ p o non-p ‘ esclude qualsiasi possibilità e quindi non esprime del tutto un atteggiamento di convinzione. Essa deve essere considerata non una frase significativa, ma una sorta di caso 1 degenere, e viene chiamato da Wittgenstein una tautologia. Essa può essere aggiunta a qualsiasi altra frase senza alterarne il significato, perché ‘ q : p o non -p ‘ concorda proprio con le stesse possibilità di ‘ q ‘. Le proposizioni di logica formale e di matematica pura sono in questo senso tautologie, e questo è ciò che si intende nel chiamarle ‘verità necessarie’.

1 Nel significato matematico in cui due linee o due punti formano una conica degenere.

Allo stesso modo ‘ p e non-p ‘ esclude ogni possibilità e non esprime alcun atteggiamento possibile: si chiama una contraddizione.

Nei termini di questi concetti possiamo spiegare cosa si intende per logica, matematica, o inferenza formale o implicazione. L’inferenza da ‘ p’ a ‘ q ‘ è formalmente garantita quando ‘ se p , allora q ‘ è una tautologia, o quando le possibilità di verità con cui ‘ p ‘ si accorda sono contenute tra quelle con quelle con cui ‘ q ‘ si accorda. Quando questo accade, è sempre possibile esprimere ‘ p ‘ nella forma ‘ q ed r ‘, in modo che la conclusione ‘ q ‘ può dirsi già contenuta nella premessa.

Prima di passare alla questione delle proposizioni generali devo dire qualcosa su una difficoltà evidente. Abbiamo supposto in precedenza che i significati dei nomi nella lingua del nostro pensatore potrebbero essere effettivamente complessi, così che quello che era per lui una frase atomica potrebbe apparire dopo la traduzione in un linguaggio più raffinato come niente del genere. Se così fosse potrebbe accadere che alcune delle combinazioni di vero e falso delle sue proposizioni atomiche sarebbero realmente contraddittorie. Questo è stato in realtà supposto essere essere il caso di ‘ blu’ e ‘rosso’, e Leibniz e Wittgenstein hanno considerato ‘ Questo è sia blu sia rosso ‘ come auto-contraddittoria, essendo la contraddizione nascosta da un difetto di analisi. Qualunque cosa si possa pensare di questa ipotesi, mi sembra che la logica formale non si occupa di questo, ma presuppone che tutte le possibilità di verità delle frasi atomiche siano realmente possibili, o almeno le considera come essere così. Nessuno potrebbe dire che l’inferenza da ‘ Questo è rosso ‘ a ‘ Questo non è blu ‘ fosse formalmente garantita come il sillogismo. Se posso tornare all’analogia degli scacchi, questa ipotesi potrebbe forse essere paragonata al presupposto che gli scacchi non sono magnetizzati così fortemente da rendere alcune posizioni sulla scacchiera meccanicamente impossibili, così che abbiamo bisogno di prendere in considerazione solo le restrizioni imposte dalle regole del gioco, e possiamo prescindere da tutte le altre che potrebbero presumibilmente derivare dalla costituzione fisica degli uomini.

Finora ci siamo dovuti confinare alle proposizioni atomiche e a quelle da esse derivate da un numero finito di operazioni vere, e a meno che la nostra considerazione sia irrimediabilmente incompleta dobbiamo ora dire qualcosa sulle proposizioni generali, come quelle che sono espresse in inglese tramite le parole ‘ tutti ‘ e ‘ qualche ‘, o nella notazione dei Principia Mathematica da variabili apparenti. Circa queste adotto il punto di vista di Wittgenstein 1 che ‘ Per tutte le x , ƒx ‘ è da considerarsi equivalente al prodotto logico di tutti i valori di ‘ ƒx ‘ , vale a dire alle combinazioni ƒx1 e ƒx2 e ƒx3 e … , e che ‘ C’è una x tale che ƒx ‘ è analogamente la loro somma logica. In relazione a tali simboli si possono distinguere in primo luogo l’elemento di generalità che entra nella questione nello specificare i termini veri, che non sono, come prima, enumerati, ma determinati come tutti i valori di una certa funzione proposizionale; e in secondo luogo l’elemento funzione verità  elemento che è il prodotto logico nel primo caso e la somma logica nel secondo.

Che cosa è originale circa le proposizioni generali è semplicemente la specificazione dei termini veri mediante una funzione proposizionale invece di una enumerazione. Così proposizioni generali, proprio come quelle molecolari, esprimono accordo e disaccordo con le possibilità di verità di proposizioni atomiche, ma lo fanno in un modo diverso e più complicato. Sentire convinzione verso ‘ Per tutte le x , ƒx ‘ ha alcune proprietà causali che noi chiamiamo il suo esprimere accordo solo con la possibilità che tutti i valori di ƒx siano veri. Per un simbolo l’avere queste proprietà casuali non è necessario, come era prima, di contenere i nomi di tutti gli oggetti coinvolti combinati in frasi atomiche adeguate, ma per una legge particolare della psicologia è sufficiente per esso di essere costruito nel modo precedentemente descritto mediante una funzione proposizionale.

1 Ed anche, a quanto pare, di Johnson. Vedere il suo Logic Part II, p.59.

Come prima, questo non deve essere considerato come un tentativo di definire ‘ tutti’ e ‘ qualche ‘, ma solo come un contributo all’analisi di ‘ Credo che tutti (o alcuni) ‘.

Questo punto di vista di proposizioni generali ha il grande vantaggio che ci permette di estendere ad esse la relazione di Wittgenstein di inferenza logica, e il suo punto di vista che la logica formale consiste di tautologie. E’ anche l’unico punto di vista che spiega come ‘ ƒa ‘può essere dedotta da ‘ Per tutte le x , ƒx ‘ e ‘ C’è un x tale che ƒx ‘da’ ƒa ‘. La teoria alternativa che ‘ C’è un x tale che ƒx ‘ dovrebbe essere considerata come una proposizione atomica della forma ‘ F ( f) ‘ ( f si applica) lascia questo del tutto oscuro; non fornisce alcuna connessione comprensibile fra a di  essere rossa e al rosso di avere un’applicazione, ma abbandonando ogni speranza di spiegare questa relazione si accontenta di etichettarla come ‘ necessaria ‘.

Tuttavia , mi aspetto che l’obiezione sarà fatta sulle seguenti linee: in primo luogo, si dirà che a non può entrare nel significato di ‘ Per tutte le x , ƒx ‘ , perché posso affermare questo senza aver mai sentito parlare di a. A questo io rispondo che questa è una parte essenziale dell’utilità della generalità del simbolismo, che ci permette di fare affermazioni su cose di cui non abbiamo mai sentito parlare e quindi non hanno nomi. Oltre che a è coinvolta nel significato di ‘ Per tutte le x , ƒx’ può essere osservato dal fatto che se io dico ‘ per tutte le x , ƒx , ‘ e qualcuno risponde ‘ non – ƒa’, allora, anche se non avevo prima sentito parlare di a, egli senza dubbio mi starebbe contraddicendo.

La seconda obiezione che mi si potrebbe fare è più seria; si potrebbe dire che questo punto di vista di proposizioni generali rende ciò che le cose ci sono nel mondo non, come in realtà è, un fatto contingente, ma qualcosa di presupposto dalla logica o nella migliore delle ipotesi da una proposizione della logica. Così ciò potrebbe indurre che, anche se potessi avere un elenco di qualsiasi cosa nel mondo ‘a’, ‘b’ , … ‘ z ‘ , ‘ Per tutte le x , ƒx ‘ non sarebbe comunque equivalente a ‘ ƒa.ƒb … ƒz ‘ , ma piuttosto sarebbero equivalenti a ‘ ƒa.ƒb …. ƒz e a, b … z ‘ sarebbero tutte le cose. Per questo Wittgenstein replicherebbe che ‘ a, b ​​… z sono tutto ciò che non ha senso, e non potrebbe essere scritto del tutto nel simbolismo migliorato di identità. Una corretta discussione di questa risposta coinvolgerebbe tutta la sua filosofia, ed è, quindi, fuori questione qui; tutto ciò che mi propongo di fare è di replicare con un tu quoque! L’obiezione evidentemente non avrebbe forza se ‘ a, b ​​… z sono tutte le cose ‘ fossero, come con adatte definizioni penso che possano essere resi, una tautologia; perché allora questo potrebbe essere lasciato fuori senza alterarne il significato. Gli obiettori quindi sosterranno che non è una tautologia, o nella loro terminologia non una proposizione necessaria; e questo essi presumibilmente riterrebbero in merito a qualsiasi proposizione del genere, cioè diranno che asserire di un insieme di cose che sono o non sono tutto non può essere né necessariamente vera né necessariamente falsa. Ma essi, io ritengo, ammetteranno che l’identità numerica e la differenza sono relazioni necessarie, che ‘ C’è un x tale che ƒx ‘ deriva necessariamente da ‘ ƒa ‘, e che tutto ciò che segue necessariamente da una verità necessaria è di per sé necessario. Se è così, la loro posizione non può essere sostenuta; per ipotesi a, b , c sono infatti non tutto, ma che ci sia un’altra cosa d. Allora questo d non è identico ad a, b, o c è un fatto necessario; quindi è necessario che vi sia un x tale che x non è identico ad a, b , o c , o che a, b , c non sono gli unici oggetti nel mondo. Si tratta quindi, anche dal punto di vista di chi obietta, di una verità necessaria e non di una verità contingente.

In conclusione, devo sottolineare il mio debito verso Wittgenstein, dal quale è derivato il mio punto di vista della logica. Tutto ciò che ho detto è dovuto a lui, tranne le parti che hanno una tendenza 1 pragmatica, che mi sembrano necessarie al fine di colmare una lacuna nel suo sistema. Ma qualunque cosa possa essere pensata di queste mie aggiunte, e comunque questa lacuna debba essere riempita, la sua concezione della logica formale mi sembra indubbiamente un enorme avanzamento di quelle di qualsiasi pensatore precedente.

Il mio pragmatismo deriva da Russell; ed è, ovviamente, molto vago e non sviluppato. L’essenza del pragmatismo assumo essere questo, che il significato di una frase deve essere definita con riferimento alle azioni alla cui asserzione condurrebbero, o, più vagamente ancora, dalle sue possibili cause ed effetti. Di questo mi sento certo, ma nulla di più preciso .

1 E l’idea che la nozione di proposizione atomica può essere relativa ad una lingua.

Universals – Note on the preceding paper da The Foundation of Mathematics di Frank Ramsey

3 Giu

Schermata 2013-11-30 alle 15.07.43Propongo la mia traduzione della quarta e quinta parte delle opere pubblicate di Frank Plumpton Ramsey  raccolte da R. B. Braithwaite sotto il titolo The Foundation of Mathematics.

Questa sezione, anche se apparentemente sembra una esercitazione di logica astratta presenta la soluzione di problemi logici e filosofici molto complessi. Si osserva in particolare l’influenza di Ludwig Wittgenstein nell’elaborazione di questi concetti che potrebbero essere da molti scambiati per “roba da matematici puri” mentre influiscono molto profondamente nel modo di concepire e interpretare a realtà.

IV

Universali (1925 )

Lo scopo di questo lavoro è quello di valutare se esista una divisione fondamentale di oggetti in due classi, particolari e universali. La questione è stata discussa da Russell in un articolo riportato negli Atti dell’Aristotelian Society del 1911. La sua conclusione che la distinzione era definitiva è stata basata su due comuni argomenti, diretti contro i due ovvii metodi di abolire la distinzione ritenendo o che gli universali sono insiemi di particolari, o che i particolari sono insiemi delle loro qualità. Questi ragionamenti, appaiono perfetti corretti fino a che sono accettabili, comunque non mi sembra che risolvano l’intera questione. Il primo, che appare di nuovo in The Problems of Philosophy, mostra come in opposizione ai nominalisti che una certa proposizione come ‘ Questo dato sensoriale è bianco ‘ deve avere come unico costituente, qualcosa come la bianchezza o la somiglianza, che non è della stesso tipo logico del dato sensoriale stesso. Il secondo argomento , anche brevemente esposto in The Nature of Existence di McTaggart, dimostra che un uomo non può essere identificato con la somma delle sue qualità.

Ma sebbene un uomo non possa essere una delle sue qualità, non c’è ragione per cui non dovrebbe essere una qualità di qualcos’altro.

In realtà gli oggetti materiali sono descritti da Whitehead come ‘ veri aggettivi Aristotelici ‘; così che non possiamo considerare che questi due argomenti interpretino la distinzione tra particolare e universale al sicuro contro ogni critica .

Che cosa è allora, mi propongo di chiedere, la differenza tra particolare e universale? Che cosa possiamo dire di una cosa che non sarà vera anche per un’altra? Se seguiamo Russell dovremo indagare su tre tipi di distinzione, psicologiche, fisiche e logiche. In primo luogo abbiamo la differenza tra una percezione e un concetto, gli oggetti di due diversi tipi di atti mentali; ma è improbabile che questa sia una distinzione di qualche fondamentale importanza, dal momento che una differenza tra due atti mentali non può corrispondere a qualche differenza in quale che sia dei loro oggetti. Poi abbiamo diverse distinzioni tra gli oggetti in base alle loro relazioni con lo spazio e il tempo; per esempio, alcuni oggetti possono essere solo in un luogo in un certo tempo; altri, come il colore rosso, possono esserlo in molti. Anche in questo caso, nonostante l’ importanza del tema , non credo che possiamo aver raggiunto il nocciolo della questione. Perché quando, per esempio , Whitehead dice che un tavolo è un aggettivo, e Johnson che si tratta di un sostantivo, non stanno discutendo in quanti posti il tavolo può essere in una sola volta, ma sulla sua natura logica. E così è con le distinzioni logiche di cui principalmente la nostra indagine deve occuparsi.

Secondo Russell la classe degli universali è la somma della classe dei predicati e della classe delle relazioni; ma questa dottrina è stato negata da Stout .1 Ma a Stout è stato già sufficientemente risposto. 2 Quindi io discuterò solo la comune opinione a cui Russell aderisce.

1 “The Nature of Universals and Propositions”, Proc. . British Academy , 1921-1922 ( ristampato in Studies in Philosophy and Psychology, 1930) .

2 Cfr. il simposio tra GE Moore , G.F. Stout & G. Dawes Hicks Aristotelian Society Supplementary Volume III, 1923.

Secondo lui i termini sono suddivisi in singolari o particolari, qualità e relazioni, qualità e relazioni che sono riuniti insieme come universali; e talvolta le qualità sono anche incluse tra le relazioni come relazioni ad un termine per distinguerle dalle relazioni a due, tre o più termini.

Johnson divide anche i termini in sostantivi e aggettivi, comprendendo le relazioni come aggettivi transitivi; ed egli considera la distinzione fra sostantivo e aggettivo per spiegare quelle tra particolare e universale. Ma tra queste autorità, che sono così lontanamente d’accordo, c’è ancora una differenza importante. Johnson sostiene che sebbene la natura di un sostantivo sia tale che può in una proposizione solo avere funzione di soggetto e mai di predicato, tuttavia un aggettivo può avere funzione sia come predicato sia come soggetto di cui un aggettivo secondario può essere predicato. Ad esempio , in ‘ la mancanza di puntualità è un difetto ‘ il soggetto è esso stesso un aggettivo – la qualità della mancanza di puntualità . Vi è quindi una mancanza di simmetria tra sostantivi e aggettivi, perché mentre un predicato deve essere un aggettivo, un soggetto può essere sia un sostantivo sia un aggettivo, e dobbiamo definire un sostantivo come un termine che può essere solo un soggetto, mai una predicato .

Russell, invece, nelle sue lezioni sull’Atomismo Logico 1 ha negato questo. Egli dice che in un aggettivo c’è qualcosa di incompleto, qualche suggerimento della forma di una proposizione; così che il simbolo dell’aggettivo non  può mai stare da solo o essere il soggetto di una proposizione, ma deve essere completato in una proposizione in cui è predicato. Così, egli dice, il simbolo appropriato per l’essere rosso non è la parola ‘rosso’, ma la funzione ‘ x è rosso ‘, e il rosso può entrare in una proposizione solo attraverso i valori di questa funzione. Quindi Russell direbbe ‘ la mancanza di puntualità è un difetto ‘ in realtà intenderebbe qualcosa come ‘ Per tutte le x, se x è non è puntuale, x è riprovevole ‘; e l’aggettivo mancanza di puntualità non è il soggetto della proposizione ma solo entra in esso come il predicato di quelle delle sue parti che sono nella forma ‘ x non è puntuale’ . Questa dottrina è la base del nuovo lavoro nella seconda edizione dei Principia Mathematica .

1 The  Monist 1918 e il 1919.

Nessuna di queste teorie sembra del tutto soddisfacente, anche se nessuna delle due possa essere confutata. Il punto di vista di Russell, infatti, comporta difficoltà nel rapporto con le nostre relazioni cognitive con gli universali, per cui era stato respinto nella prima edizione dei Principia, ma queste difficoltà mi sembrano, come ora a Russell, affatto insormontabili. Ma non potevo discuterne qui senza intraprendere innumerevoli questioni irrilevanti rispetto ai punti principali che desidero esaminare.

Né l’una né l’altra teoria, quindi, può essere confutata, ma ad entrambe possono essere sollevate obiezioni che sembrerebbero avere una certa forza. Per esempio, Russell insiste che in una relazione tra due termini non può esserci un terzo termine che si intrometta tra questi, perché allora non sarebbe affatto una relazione, e il solo elemento realmente relazionale consisterebbe nelle relazioni tra questo nuovo termine e i due termini originali. Questo è il tipo di considerazione da cui Bradley deduce il suo regresso all’infinito, che Russell a quanto pare ora approva.

Johnson potrebbe rispondere che per lui l’elemento di connessione o strutturale non è la relazione, ma i legami caratterizzanti e di accoppiamento; ma questi legami restano gli oggetti più misteriosi. Si potrebbe anche obiettare che Johnson non costruisce particolari e universali abbastanza diversi, o prende in considerazione l’incompletezza peculiare degli aggettivi che appare nella possibilità di anteporre ad essi l’ ausiliare ‘essere ‘; ‘essere rosso’, ‘ essere un uomo ‘ non sembrano cose reali come una sedia e un tappeto .

Contro Russell potrebbe essere domandato come possono esistere oggetti come i suoi universali, che contengono la forma di una proposizione e così sono incompleti. In un certo senso, si potrebbe insistere, tutti gli oggetti sono incompleti; e non possono verificarsi nei fatti, salvo in combinazione con altri oggetti, e contengono le forme di proposizioni di cui sono componenti. In che modo gli universali lo fanno più di qualsiasi altra cosa?

Evidentemente, tuttavia, nessuno di questi argomenti sono davvero decisivi, e la posizione è estremamente insoddisfacente per chiunque con una reale curiosità in merito a una questione così fondamentale .

In questi casi è una massima euristica che la verità non si trova in una dei due punti di vista controversi ma in qualche terza possibilità su cui non si è ancora riflettuto, che possiamo scoprire solo rifiutando qualcosa assunto come ovvio da entrambi i contendenti.

Entrambe le teorie controverse fanno un presupposto importante che, a mio avviso, deve essere solo esaminato per dubitarne.

Esse assumono una fondamentale antitesi tra soggetto e predicato, che se una proposizione è composta da due termini accoppiati, questi due termini devono funzionare in diversi modi, uno come soggetto, l’altro come predicato. Così in ‘ Socrate è saggio ‘ , Socrate è il soggetto, saggio il predicato. Ma supponiamo che noi si giri la proposizione e si dica ‘ la Sapienza è una caratteristica di Socrate’, allora la saggezza, l’ex predicato, è ora il soggetto . Ora mi sembra chiaro come qualsiasi cosa può esserlo nella filosofia che le due frasi ” Socrate è saggio ‘, ‘ La saggezza è una caratteristica di Socrate ‘ affermano lo stesso fatto ed esprimono la stessa proposizione. Esse non sono, ovviamente, la stessa frase, ma hanno lo stesso significato, come due frasi in due lingue diverse possono avere lo stesso significato. Quale frase usiamo è una questione sia di stile letterario, o del punto di vista da cui ci avviciniamo al fatto. Se il centro del nostro interesse è di Socrate diciamo ‘ Socrate è saggio ‘, se stiamo discutendo sulla saggezza possiamo dire ‘ La saggezza è una caratteristica di Socrate ‘, ma qualsiasi cosa diciamo intendiamo la stessa cosa. Ora, di una di queste frasi ‘ Socrate ‘ è il soggetto , nell’altra ‘ la saggezza ‘; e così di quale delle due è soggetto, e di quale predicato, dipende da quella particolare frase che usiamo per esprimere la nostra proposizione, e non ha nulla a che fare con la natura logica di Socrate o della saggezza, ma è del tutto una questione per i grammatici. Allo stesso modo, con un linguaggio sufficientemente elastico qualsiasi proposizione può essere espressa in modo che uno qualsiasi dei suoi termini sia il soggetto. Quindi non vi è alcuna distinzione essenziale tra il soggetto di una proposizione e il suo predicato, e nessuna classificazione fondamentale di oggetti può essere basata su una tale distinzione.

Non pretendo che l’argomento di cui sopra sia immediatamente conclusivo; quello che io sostengo è che si gettano dubbi su tutte le basi della distinzione tra particolare e universale come si deduce da quella tra soggetto e predicato, e che la questione richiede un nuovo esame. Si tratta di un punto che è stato spesso presentato da Russell che i filosofi sono molto suscettibili di essere tratti in inganno dalla costruzione soggetto-predicato della nostra lingua. Essi hanno supposto che tutte le proposizioni devono essere di forma soggetto-predicato, e così sono stati indotti a negare l’esistenza di relazioni. Io sostengo che quasi tutti i filosofi, tra cui lo stesso Russell, sono stati ingannati dalla lingua in un modo di molto di più vasta portata di questo; che tutta la teoria dei particolari e universali è dovuta allo scambiare per una caratteristica fondamentale della realtà ciò che è solamente una caratteristica del linguaggio.

Dunque, esaminiamo da vicino questa distinzione tra soggetto e predicato, e per semplicità seguiamo Johnson e includiamo le relazioni tra predicati e i loro termini tra i soggetti. La prima domanda che dobbiamo porci è questa: quali proposizioni sono quelle che hanno un soggetto o soggetti e un predicato? È questo il caso di tutte le proposizioni o solo di alcune? Prima, però, di rispondere a questa domanda, dobbiamo ricordarci che il compito su cui siamo impegnati non è puramente un compito di grammatica inglese; non siamo bambini di scuola che analizzano frasi sul soggetto, l’estensione del soggetto, complemento e così via, ma siamo interessati non tanto nelle frasi stesse, quanto in quello che significano, da cui speriamo di scoprire la natura logica della realtà.

Quindi dobbiamo cercare i significati di soggetto e predicato che non sono puramente grammaticali, ma che hanno un vero e proprio significato logico.

Cominciamo con una certa proposizione come ‘ O Socrate è saggio o Platone è stupido ‘. A questa, probabilmente si sarà d’accordo, il concetto di soggetto e predicato è inapplicabile; ma può essere applicabile alle due parti ‘ Socrate è saggio ‘, ‘ Platone è sciocco ‘, ma l’intero ‘ O Socrate è saggio o Platone è sciocco ‘ è una proposizione alternativa e non una proposizione con un soggetto o predicato. Ma a questo qualcuno può fare la seguente obiezione: in una tale proposizione possiamo assumere qualsiasi termine ci pare, diciamo Socrate, essere il soggetto.

Il predicato sarà poi ‘ essere saggio a meno che Platone sia stupido ‘ o ​​la funzione proposizionale x^ è saggio o Platone è stupido ‘ .

La frase ‘ essere saggio a meno che Platone sia sciocco ‘ sta per un complesso universale che si afferma per caratterizzare Socrate. Un tale punto di vista, anche se molto spesso accettato, a me sembra, tuttavia, certamente sbagliato. Al fine di rendere le questioni più chiare prendiamo un caso più semplice, una proposizione nella forma ‘ aRb ‘; allora questa teoria sosterrà che ci sono tre proposizioni strettamente connesse; una afferma che la relazione R intercorra tra i termini a e b, la seconda asserisce il possesso da parte di a di un complesso di proprietà di ‘ avere R  con b ‘ mentre la terza afferma che b ha la proprietà complessa che a ha R con essa (b). Queste devono essere tre diverse proposizioni perché hanno diversi insiemi di costituenti, e ancora che non sono tre proposizioni, ma una proposizione, perché tutte dicono la stessa cosa, e cioè che a ha R con b. Così la teoria degli universali complessi è responsabile di una trinità incomprensibile, senza senso come quella della teologia. (1)

  1. (N.d.t. Questa espressione rivela i danni della cattiva espressione dei principi dottrinari a cui sono stati sottoposti i cristiani nella loro storia. Infatti nei testi di dottrina si definiva Dio come l’essere perfettissimo signore del cielo e della terra in tre persone uguali e distinte. Quindi si poneva il problema di capire come un Dio unitariamente definito potesse essere una trinità. E’ evidente che in questi termini si proponeva semplicemente una contraddizione logica perché la definizione di uno non può mai coincidere con la definizione di tre a meno di modificare l’aritmetica in modo sostanziale con il risultato tangibile di non poterla più usare nella pratica. Il problema è solo di comunicazione in quanto questo dare per nonsenso ed incomprensibile la trinità è un problema solo di comunicazione dottrinaria. La definizione della trinità deriva dalla necessità di dare una descrizione di un Dio trascendente (quindi fuori dal mondo fisico) con le seguenti due caratteristiche fondamentali: libero e Ente relazionale. Infatti L’uomo secondo la teologia giudaico-cristiana è stato creato ad immagine di Dio. E l’uomo è libero e relazionale. E’ abbastanza evidente che l’alternativa di un Dio unitariamente definito e non trascendente ovvero a teologia panteistica è una forma di materialismo che coincide con le motivazioni dell’ateismo. Mi sembra evidente che se tutto il mondo è Dio e quindi è soggetto alle limitazioni spazio-temporali ed etiche del nostro essere non c’è nessuna differenza con l’ateismo in quanto ha connotazioni perfettamente equivalenti. Tra l’altro un mondo così concepito risulta avere la caratteristica di non considerare necessaria la libertà e un’etica di cooperazione tra le persone in quanto tutto è regolato dal caso e lo scopo della vita di ogni singolo uomo sarebbe limitato a ridurre i casi sfavorevoli al minimo, senza poter comunque annullarli per essere l’avversità statisticamente prevalente dei casi contrari ai desiderata. Quindi per descrivere un Dio trascendente e relazionale come l’uomo che non è scindibile dalla sua relazionalità occorre definire l’unico Dio come Ente costituito di Persone in relazione tra loro. Per la definizione di perfezione, quindi non comprendendo in Dio l’egoismo, occorre che questa relazione sia lo scambio di amore tra il Padre ed il figlio mediato dallo Spirito, così come accade nell’uomo in cui lo scambio relazionale tra le persone avviene tramite il linguaggio di cui il sistema proposizionale è un mezzo importantissimo. Quindi come nel linguaggio il significato passa da A a B tramite, ad esempio la logica proposizionale, così l’Essere trasmette la sua essenza al Figlio tramite lo Spirito che, guarda caso, è anche comunicazione in quanto trasmette agli uomini l’indicibile di un Dio trascendente che non governa il mondo, ma fornisce informazione sulla libertà e l’uguaglianza fraterna degli uomini (quindi nelle loro diversità) e li invita all’adesione al Corpo mistico in cui possano partecipare, nelle loro individualità, al circuito di amore di Dio. Dio non può governare il mondo perché altrimenti verrebbe meno un altro polo della similitudine dell’uomo con Dio, ovvero la libertà di vivere e scegliere come meglio crede. L’espressione di Dio è quindi fatta tramite il linguaggio che ne da’ una rappresentazione, per poterne parlare, ma che non può corrispondere alla vera natura di Dio perché trascendente e quindi fuori del mondo spazio-temporale. In questo senso il concetto ha caratteristiche di mistero, ovvero riguarda una realtà che non possiamo esprimere e non perché riguarda una realtà che ci viene tenuta nascosta. E’ proprio la necessità di tenere come supremo principio la libertà che la rivelazione non può andare oltre i termini dei metodi di scelta umani ovvero non può che essere basata sull’informazione e non sul dato fisico diretto che toglierebbe qualsiasi libertà di scelta. Pertanto la presenza di Dio si sostanzierebbe nelle Parola che è il Verbo fatto carne e nella presenza dello Spirito che supporta materialmente la diffusione della Parola. E’ la libera scelta individuale di aderire al circuito dell’amore di Dio o di rifiutarlo. Secondo la teologia cristiana la libertà è nello stesso atto di fede che si concretizza nella fede nella speranza dell’amore di Dio. E quindi è la libera scelta di far parte del mondo di quanti amano il prossimo perché sperano nell’amore di Dio. Questo concetto di voler appartenere ad un gruppo è sempre stato presente negli uomini, spesso con deviazioni antisociali,ma anche con gruppi che seguono non solo l’interesse degli adepti ma che risultano essere anche aperti alle esigenze degli altri. Un esempio è proprio la Apostles Society di Cambridge che perseguiva lo scopo, associando le migliori menti matematiche dell’epoca, di promuovere lo sviluppo intellettuale di tutta l’umanità. Infine, per semplificare: la relazione aRb non può essere interpretata come una terna perché solo insieme è una relazione tra a e b e a nessuno verrebbe in mente di dire che una proposizione sia una e trina.)

Questo argomento può essere rafforzato prendendo in considerazione il processo di definizione, che è il seguente. Per certi scopi ‘aRb ‘ può essere un simbolo inutilmente lungo, così che sarebbe conveniente accorciarlo in ‘ φb . ‘ Questo viene fatto per definizione, φx = aRx, che significa che qualsiasi simbolo nella forma φx deve essere interpretato nel senso che si riferisce al corrispondente simbolo aRx, per il quale è un’abbreviazione. In casi più complessi tale abbreviazione è spesso molto utile, ma se ne potrebbe sempre fare a meno se il tempo e la carta lo permettono. Chi crede negli universali complessi è ora di fronte a un dilemma: è ​​’ φ ‘ , così definito, un nome per la complessa proprietà di x che consiste in a di avere R con x? Se è così, allora φx sarà l’affermazione che x ha questa proprietà; ma sarà una proposizione soggetto-predicato il cui soggetto è x e il predicato φ; e questo non è identico alla proposizione relazionale aRx .

Ma in quanto φx è per ipotesi definita essere l’abbreviazione di aRx questo è assurdo. Perché se una definizione non deve essere interpretata con il significato che il definiendum e il definiens hanno lo stesso significato, il processo di definizione diventa incomprensibile e si perde ogni giustificazione per l’interscambio tra definiens e definiendum a piacere, da cui dipende tutta la sua utilità. Supponiamo invece che ‘ φ ‘ , come sopra definito, non sia un nome per una proprietà complessa; allora come può la proprietà complessa mai diventare oggetto della nostra osservazione, e come possiamo mai parlarne, visto che ‘ φ ‘, il suo unico nome possibile, non è per nulla un nome ma un’abbreviazione per qualcos’altro? E poi che ragione ci può essere per postulare l’esistenza di questo oggetto?

Nonostante questa reductio ad absurdum della teoria, potrebbe valere ancora la pena di indagare la sua origine e sull’essere essa ritenuto da tante persone, tra cui in passato da me stesso, senza che si verifichi per essi di dubitarne. La ragione principale di questo è credo che si trovi nella comodità linguistica; essa ci dà un oggetto che e ‘ il significato ‘ di ‘ φ ‘. Spesso vogliamo parlare di ‘ il significato di ” φ “‘ ed è più semplice supporre che questo è un termine unico piuttosto che riconoscere che si tratta di una questione molto più complicata, e che ‘ φ ‘ ha una relazione di significato non con un oggetto complesso, ma con gli oggetti più semplici, che sono nominati nella sua definizione.

Vi è, tuttavia, un altro motivo per cui questo punto di vista è così popolare, e che è la difficoltà immaginaria che altrimenti sarebbe avvertita nell’uso di una funzione proposizionale variabile.

Come, ci si potrebbe chiedere, dobbiamo interpretare questa affermazione come ‘a ha tutte le proprietà di b ‘, tranne nell’ipotesi che esistano proprietà? La risposta è che deve essere interpretato come il prodotto logico di tutte le proposizioni che possono essere costruite nel seguente modo: prendiamo una proposizione in cui si a si presenta, per esempio φa, scambiamo a con b ed ottenere φb, e poi formiamo la proposizione φb . ⊃ . φa. In realtà non è così semplice come questo, ma una più accurata considerazione di questo coinvolgerebbe una quantità di noiosi dettagli, che quindi sarebbero fuori luogo qui; e possiamo assumere con una sufficiente approssimazione che ‘a ha tutte le proprietà di b ‘ è l’affermazione congiunta di tutte le proposizioni della forma φb . ⊃ . φa, dove non c’è necessità per φ di essere il nome di un universale, in quanto è solo il supporto di una proposizione in cui a si presenta. Di qui la difficoltà è del tutto immaginaria. Si può osservare che lo stesso vale per qualsiasi altro caso di variabili apparenti alcuni dei valori delle quali sono simboli incompleti, e questo può spiegare la tendenza ad affermare che alcuni simboli incompleti di Russell non sono realmente incompleti, ma i nomi di proprietà o di predicati.

Concludo, quindi, che gli universali complessi sono da respingere; e che una certa proposizione come ‘ O Socrate è saggio o Platone sciocco ‘ non ha né soggetto né predicato.

Argomentazioni analoghe valgono per ogni proposizione composta, cioè ogni proposizione contenente determinati termini come ‘e’ , ‘o’ , ‘non’ , ‘ tutto’ , ‘ qualche ‘; e quindi se vogliamo trovare una distinzione logica tra soggetto e predicato da qualche parte sarà nelle proposizioni atomiche, come le chiama Russell, che possono essere espresse da frasi che non contengono nessuna delle parole di cui sopra, ma solo nomi e, forse, una copula.

La distinzione tra soggetto e predicato allora deriverà dai diversi nomi in una proposizione atomica con funzioni differenti; e se questa non è una distinzione puramente grammaticale deve corrispondere ad una differenza nel funzionamento dei vari oggetti in un fatto atomico, in modo che ciò che dobbiamo innanzitutto esaminare è la costruzione del fatto atomico fuori dai suoi componenti. A proposito di questo potrebbero essere suggeriti tre punti di vista: il primo è quello di Johnson secondo cui i componenti sono collegati tra loro da ciò che egli chiama il vincolo che li caratterizza. La natura di questa entità è piuttosto oscura, ma penso che possiamo prenderlo come qualcosa che non è un costituente del fatto, ma rappresentato nel linguaggio della copula ‘ è’, e siamo in grado di descrivere questa teoria sostenendo che la congiunzione sia realizzata da una vera e propria copula .

Poi vi è la teoria di Russell che la congiunzione è realizzata da uno dei costituenti; che in ogni fatto atomico ci deve essere un componente che è per sua natura incompleto o connettivo e, per così dire, tiene gli altri componente insieme. Questo componente sarà un universale, e gli altri i particolari. Infine vi è la teoria di Wittgenstein che non esiste una copula, né un componente apposito connesso, ma che, come egli si esprime, gli oggetti si collegano l’uno all’altro, come gli anelli di una catena.

Dal nostro punto di vista è la seconda di queste teorie che richiede più attenzione; perché la prima e la terza in realtà non spiegano nessuna differenza nella modalità di funzionamento di soggetto e predicato, ma lasciano questo come un mero dogma. Solo nella teoria di Russell ci sarà una differenza intelligibile tra particolare e universale, basata sulla necessità che vi sia in ogni fatto un termine che collega o universale, che corrisponde alla necessità in ogni frase di avere un verbo.

Così è la teoria di Russell che dobbiamo prendere in considerazione per prima.

La grande difficoltà con questa teoria sta nel capire come una sorta di oggetto può essere appositamente incompleto. C’è un significato in cui qualsiasi oggetto è incompleto; cioè che può verificarsi solo in un fatto per un collegamento con uno o più oggetti di tipo opportuno; proprio come qualsiasi nome è incompleto, perché per formare una proposizione dobbiamo unirlo a determinati altri nomi di tipo adatto. Come dice Wittgenstein : “L’oggetto è indipendente, nella misura in cui può verificarsi in tutte le circostanze possibili, ma questa forma di indipendenza è una forma di connessione con il fatto atomico, una forma di dipendenza. (È impossibile per alcune parole presentarsi in due modi diversi, da sole e nella proposizione) ” 1 E Johnson : “In definitiva un universale rappresenta un aggettivo che può caratterizzare un particolare e un particolare rappresenta un sostantivo che può essere caratterizzato da un universale.” 2 Così possiamo ammettere che ‘ saggio ‘ comporta la forma di una proposizione, ma così è per’ Socrate ‘, ed è difficile vedere qualche fondamento per distinguerli tra loro.

Questa è la sostanza della critica di Johnson che Russell non permette che l’aggettivo stia da solo, e che nel trattare ‘ s è p ‘come una funzione di due variabili che assume che gli argomenti non siano s e p , ma s e ‘ Schermata 2013-08-22 alle 18.42.59  è p’.

1 Tractatus logico-philosophicus, 2.0122. “La cosa è indipendente nella misura in cui essa può occorrere in tutte le situazioni possibili, ma questa forma d’indipendenza è una forma di connessione con lo stato di cose, una forma di dipendenza (E’ impossibile l’occorrer di parole in due diversi modi, da sole e nella proposizione) – Einaudi Paperbacks trad. Amedeo G. Conte.

2 Logic Parte I, pag. 11.

In risposta a questa critica Russell, immagino, userebbe due linee di ragionamento, di cui dobbiamo esaminare la validità.

Il primo risiederebbe sulla grande convenienza nella logica matematica del suo simbolismo funzionale, del quale egli potrebbe dire non ci sarebbe nessuna spiegazione se non che questo simbolismo corrisponde alla realtà più da vicino di ogni altro. La sua seconda argomentazione sarebbe che ognuno può avvertire una differenza tra particolari e universali; che la prevalenza del nominalismo ha dimostrato che la realtà degli universali era sempre sospetta, e che questo era probabilmente perché essa differisce dai particolari per essere meno indipendente, meno autosufficiente. Anche che questa era l’unica ragione della differenza tra particolari e universali, che li rendono effettivamente tipi di oggetti diversi, come evidentemente erano, e non semplicemente diversi in relazione a noi o alla nostra lingua. Ad esempio Johnson descrive il particolare che si presenta al pensiero per il suo carattere di essere determinato nel pensiero, e altri potrebbero dire che un particolare sia quello che era significato dal soggetto grammaticale di una frase; e in base a questi punti di vista ciò che era particolare, quello che era universale dipenderebbero da caratteristiche inessenziali della nostra psicologia o del nostro linguaggio.

Prendiamo queste linee di ragionamento in ordine inverso, cominciando con l’avvertire la differenza tra particolare e universale, e rimandando la particolare convenienza simbolica delle funzioni proposizionali. Chiunque, si può dire, vede una differenza tra Socrate e la saggezza. Socrate è una vera entità indipendente, la saggezza una qualità e quindi essenzialmente una qualità di qualcos’altro. La prima cosa da notare su questo ragionamento è che in realtà non riguarda per niente oggetti.

‘ Socrate è saggio ‘ non è una proposizione atomica, e i simboli ‘ Socrate ‘e’ saggio ‘ non sono i nomi di oggetti, ma simboli incompleti. E secondo Wittgenstein, con cui son d’accordo, questo sarà il fatto con qualsiasi altro esempio che può essere suggerito, dal momento che non siamo messi al corrente con alcuni oggetti autentici o proposizioni atomiche, ma semplicemente li deduciamo come presupposto da altre proposizioni. Quindi la distinzione che avvertiamo è quella tra due tipi di simboli incompleti, o costruzioni logiche, e non si può dedurre senza ulteriori indagini che ci sia una qualche corrispondente distinzione tra due tipi di nomi o oggetti.

Noi possiamo, credo, facilmente ottenere un’idea più chiara della differenza tra questi due tipi di simboli incompleti (Wittgenstein le chiama ‘espressioni’), caratterizzate da ‘ Socrate ‘ e ‘ saggio ‘.

Consideriamo quando e perché un’espressione si presenta, per così dire, come una singola unità. Per esempio ‘ aRb ‘ non si divide naturalmente in ‘a’ e ‘ Rb ‘ , e vorremmo sapere perché qualcuno dovrebbe quindi dividere e isolare l’espressione ‘Rb ‘ . La risposta è che se fosse una questione di questa sola proposizione, non ci sarebbe motivo di dividerla in questo modo, ma che l’importanza delle espressioni si pone, come sottolinea Wittgenstein, solo in rapporto alla generalizzazione.

Non è ‘ aRb ‘ ma ‘ ( x ) . xRb ‘ che rende Rb importante.

Nello scrivere ( x ) . xRb usiamo l’espressione Rb per raccogliere insieme l’insieme delle proposizioni xRb che vogliamo affermare essere vere; ed è qui che l’espressione Rb è veramente essenziale, perché è questo che è comune a questo insieme di proposizioni. Se ora ci rendiamo conto che questo è l’uso essenziale delle espressioni, possiamo vedere immediatamente qual è la differenza tra Socrate e saggio. Attraverso l’espressione ‘ Socrate ‘ raccogliamo insieme tutte le proposizioni in cui si verificano, cioè, tutte le proposizioni che dovremmo ordinariamente dire di essere intorno a Socrate, come ‘ Socrate è saggio ‘, ‘ Socrate non è né saggio né giusto ‘. Queste proposizioni sono raccolte insieme come valori di ‘ φ Socrate ‘, dove φ è una variabile.

Consideriamo ora l’espressione ‘ saggio; usiamo questa per raccogliere insieme le proposizioni ‘ Socrate è saggio ‘ , ‘ Platone è saggio ‘ , e così via , che sono i valori di’ x è saggio ‘ . Ma questo non è l’unico insieme che possiamo usare per costruire ‘ saggio’; proprio come abbiamo usato ‘ Socrate ‘ per raccogliere tutte le proposizioni in cui si verificava, possiamo usare ‘ saggio ‘ per raccogliere tutte quelle in cui si verifica questo, comprese non solo quelle come ‘ Socrate è saggio’, ma anche quelle come ‘ né Socrate né Platone sono saggi ‘, che non sono valori di ‘ x è saggio ‘, ma solo della diversa funzione ‘ φ saggio ‘, dove φ è una variabile . Così mentre Socrate dà solo un insieme di proposizioni, saggio ne da’ due: una simile a quella data da Socrate, vale a dire l’insieme di tutte le proposizioni in cui si verifica saggio, e l’altra un insieme più ristretto di proposizioni della forma ‘ x è saggio ‘ .

Questa è ovviamente la spiegazione della differenza che avvertiamo tra Socrate e saggio, che Russell esprime dicendo che con saggio dobbiamo introdurre la forma di una proposizione. Dal momento che tutte le espressioni devono essere completate per formare una proposizione, era già difficile capire come saggio potesse essere più incompleto di Socrate. Ora possiamo vedere che la ragione di questo è che, mentre con ‘ Socrate ‘ abbiamo solo l’idea di completarlo in qualche modo in una proposizione, con ‘ saggio ‘ non abbiamo solo questo, ma anche l’idea di completarlo in un modo particolare, fornendoci non solo una qualsiasi proposizione in cui si presenta saggio, ma anche quella in cui si verifica in un modo particolare, che potremmo chiamare la sua presenza come predicato, come in ‘ Socrate è saggio ‘.

A che cosa è dovuta questa differenza, ed è una vera differenza? Vale a dire, non possiamo fare con ‘ Socrate ‘ quello che facciamo con ‘ saggio’, e usarlo per raccogliere un insieme di proposizioni più ristrette di tutto l’insieme in cui si verifica? È questo impossibile, o è semplicemente che in realtà non lo facciamo mai? Queste sono le domande a cui ora dobbiamo cercare di rispondere. Il modo per farlo sembrerebbe essere il seguente Supponiamo che possiamo distinguere tra le proprietà di Socrate un certo sottoinsieme che possiamo chiamare qualità, l’idea sarebbe più o meno che una semplice proprietà è una qualità. Allora potremmo formare in collegamento con ‘ Socrate ‘ due serie di proposizioni così come possiamo in connessione con ‘ saggio’. Ci sarebbe una più vasta serie di proposizioni in cui ‘ Socrate ‘ si presenta del tutto, che noi diciamo che affermino le proprietà di Socrate, ma anche ci sarebbe un insieme più ristretto che asserisce le qualità di Socrate.

Quindi supponendo che giustizia e saggezza siano qualità, ‘ Socrate è saggio ‘ , ‘ Socrate è giusto ‘ apparterrebbero al gruppo più ristretto e sarebbero i valori di una funzione ‘ Socrate è q ‘. Ma ‘ Socrate non è né saggio né giusto ‘ non asserirebbe una qualità di Socrate, ma solo una caratteristica complessa o di proprietà, e sarebbe solo un valore della funzione ‘ φ Socrate ‘, non di ‘ Socrate è q ‘.

Ma anche se una tale distinzione fra qualità e proprietà può essere logicamente possibile, non sembriamo mai tenerne conto sistematicamente . Qualche luce può essere gettata su questo fatto da un paragrafo in Logic di Johnson in cui egli sostiene che, sebbene ” possiamo costruire correttamente un aggettivo composto da semplici aggettivi, tuttavia la natura di qualsiasi termine con funzione di sostantivo è tale che è impossibile costruire un autentico sostantivo composto”.1 Così dalle due proposizioni ” Socrate è saggio ‘, ‘ Socrate è giusto ‘ possiamo formare la proposizione ‘ Socrate non è né saggio né Socrate è giusto’, o , in breve, ‘ Socrate non è né saggio né giusto’; che ancora, secondo Johnson, afferma che un aggettivo di Socrate, è un valore di ‘ φ Socrate ‘ e ​​giustificherebbe ‘ ( ∃ φ ) . φ Socrate ‘ o’ Socrate ha qualche proprietà ‘.

1 Parte II, p. 61.

Se, d’altra parte, prendiamo le due proposizioni ” Socrate è saggio ‘ , ‘ Platone è saggio ‘ e formiamo da queste ‘ Né Socrate è saggio né Platone è saggio ‘; questo non è un valore di ‘ x è saggio ‘ e non giustificherebbe ‘ ( ∃ x ) . x è saggio ‘, o ‘ Qualcuno è saggio ‘. Quindi, in quanto ‘ Socrate non è né saggio né giusto ‘ giustifica ‘ Socrate ha qualche aggettivo ‘ possiamo dire che ‘ né saggio né giusto ‘ è un aggettivo composto; ma poiché ‘ né Socrate né Platone sono saggi ‘ non giustifica che ‘ qualcuno è saggio ‘ , ‘ né Socrate , né Platone ‘ non può essere un sostantivo composto non di più di quanto qualcuno sia un uomo composto.

Se, tuttavia, noi potessimo formare un insieme di qualità contrapposte a proprietà, ‘ Socrate non è né saggio né giusto ‘ non giustificherebbe ‘ Socrate ha una certa qualità e ‘ né saggio, né giusto’ non sarebbero una qualità. Contro questo Johnson dice che non esiste un criterio universalmente valido con il quale possiamo distinguere le qualità da altre proprietà; e questa è certamente una contesa molto plausibile quando si parla, come noi ora, delle qualità e delle proprietà delle costruzioni logiche come Socrate. Perché la distinzione è solo realmente evidente in relazione ad un autentico oggetto; allora possiamo dire che φ rappresenta una qualità quando φa è una proposizione atomica a due termini, e questo distinguerebbe le qualità da altre funzioni proposizionali o proprietà. Ma quando il soggetto a è una costruzione logica e φa una proposizione composta di cui non conosciamo l’analisi, è difficile sapere che cosa significherebbe chiedendo se φ sia semplice, e chiamandola, se semplice, qualità. Avremmo chiaramente una questione non di assoluta ma di relativa semplicità.

Eppure è facile vedere che, in teoria, una analoga distinzione può certamente essere fatta anche per i simboli incompleti. Prendiamo qualsiasi simbolo incompleto ‘ α’; questo sarà definito non isolatamente, ma in combinazione con qualsiasi simbolo di un certo tipo x . Così potremmo definire che αx significa αRx . Allora questo simbolo incompleto ‘α’ ci darà due insiemi di proposizioni: l’insieme αx ottenuto completandolo nel modo indicato nella sua definizione; e l’insieme generale delle proposizioni in cui α si verifica affatto, vale a dire tutte le funzioni verità delle proposizioni dell’insieme precedente e le proposizioni costanti che non contengono α. Così, nei due casi famosi delle descrizione e delle classi, come trattati in Principia Mathematica, l’insieme più ristretto sarà quello in cui la descrizione o la classe ha una evenienza primaria, l’insieme più ampio quello in cui ha qualche tipo di evenienza primaria o secondaria, dove il termine di evenienza ‘ primaria’ e ‘secondaria’ hanno i significati spiegati in Principia . In sintesi per quanto riguarda qualsiasi simbolo incompleto possiamo distinguere il suo presentarsi primario e secondario, e questa è fondamentalmente la stessa distinzione che abbiamo trovato essere caratteristica dell’aggettivo. Così che qualsiasi simbolo incompleto è in realtà un aggettivo, e quelli che appaiono sostantivi solo lo sono in virtù della nostra mancanza di distinguere o per l’incapacità o per la negligenza le loro evenienze primarie e secondarie. Come esempio pratico prendiamo il caso degli oggetti materiali; siamo abituati a considerarli come sostantivi, vale a dire che noi li usiamo per definire gli insiemi di proposizioni in un modo solo, e non facciamo distinzione tra loro evenienze primarie e secondarie. Almeno nessuno ha introdotto tale differenziazione finché Whitehead ha dichiarato che gli oggetti materiali sono aggettivi degli eventi in cui sono situati, in modo che il verificarsi primario di un oggetto materiale A è in una proposizione ‘ A si trova in E ‘.

Da tali proposizioni come questa possiamo costruire tutte le altre proposizioni in cui A si presenta. Così ‘ A è rosso’ sarà ‘ per tutte le E , A si trova in E implica che il rosso si trova in E ‘, in cui A ha una presenza secondaria. Quindi la distinzione tra un verificarsi primario e secondario non è semplicemente dimostrato come logicamente necessario, ma in questo caso effettuato praticamente.

La conclusione è che, per quanto riguarda i simboli incompleti, la fondamentale distinzione non è tra sostantivo e aggettivo, ma tra un’evenienza primaria e secondaria; e che un sostantivo è semplicemente una costruzione logica tra cui non riusciamo a distinguere le evenienze primarie e secondarie. In modo che essere un sostantivo non è una proprietà oggettiva, ma soggettiva nel senso che non dipende infatti da una qualsiasi mente, ma dagli elementi comuni nelle menti e le finalità di tutti gli uomini .

Questa è la mia prima conclusione, che è credo di una certa importanza nella filosofia della natura e della mente; ma non è la conclusione che che più desidererei sottolineare, e non risponde alla domanda con cui ho iniziato il mio articolo. Perché si tratta di una conclusione sul metodo e la possibilità di dividere alcune costruzioni logiche in sostantivi e aggettivi, essendo questa in relazione con quelle costruzioni logiche che hanno originato per tradizione l’idea di aggettivo e di sostantivo.

Ma la vera domanda in questione è la possibilità non di dividere le costruzioni logiche, ma reali oggetti in particolari e universali, e per rispondere a questo dobbiamo tornare indietro e riprendere il filo del discorso, dove l’abbiamo abbandonato per questa lunga digressione sulle costruzioni logiche .

Abbiamo visto in precedenza che la distinzione tra particolare e universale è derivato da quella tra soggetto e predicato che abbiamo trovato solo che si verifica nelle proposizioni atomiche. Abbiamo poi esaminato le tre teorie delle proposizioni atomiche o meglio, dei fatti atomici, la teoria di un legame di Johnson, di Russell che l’unione è determinata dagli universali dei quali qui deve esisterne uno e solo uno in ogni fatto atomico, e di Wittgenstein secondo cui gli oggetti si uniscono l’uno all’altro come gli anelli di una catena. Abbiamo osservato che di queste teorie solo quella di Russell realmente assegnava una funzione diversa al soggetto e al predicato e così ha dato un significato alla distinzione tra questi, e si è proceduto a discutere questa teoria. Abbiamo trovato che alle critiche di Johnson Russell aveva due risposte possibili; una che è quella di sostenere che la sua sola teoria ha tenuto conto della differenza che avvertiamo esserci tra Socrate e la saggezza, l’altra che la sua notazione è molto più opportuna di qualsiasi altra e deve quindi corrispondere più strettamente ai fatti. Abbiamo poi preso il primo di questi argomenti , e esaminato la differenza tra Socrate e saggezza. Ciò che abbiamo trovato consiste nel fatto che mentre Socrate determinava solo una serie di proposizioni in cui si presenta, saggio determinava due di tali insiemi, l’insieme completo ‘f saggio’, e l’insieme più ristretto ‘ x è saggio ‘. Abbiamo poi esaminato il motivo di questa differenza tra i due simboli incompleti Socrate e saggio, e abbiamo deciso che era di carattere soggettivo e dipendeva da interessi ed esigenze umani.

Quello che dobbiamo ora considerare è se la differenza tra Socrate e saggio ha una tale attinenza sulla composizione dei fatti atomici come Russell asserisce che esso abbia. Possiamo utilmente coniugare questo con la considerazione dell’altro possibile argomento di Russell dalla comodità superiore del suo simbolismo. L’essenza di questo simbolismo, come Johnson ha osservato, consiste nel non lasciare l’aggettivo da solo, ma nel renderlo una funzione proposizionale con il collegarlo a una variabile x. Un possibile vantaggio di questa procedura ad un tempo si suggerisce nei termini del nostro precedente trattamento della differenza tra sostantivo e aggettivo; e cioè che aggiungere la variabile x ci aiuta a fare la distinzione che noi richiediamo di fare nel caso dell’aggettivo, ma non nel caso del sostantivo, fra i valori di φx e quelli di f ( φz circonflesso ) dove f è una variabile. Solo così, si potrebbe dire, possiamo distinguere ( x ) . φx da ( f), f . ( φz circonflesso ). Ma una piccola considerazione è richiesta per vedere che questo vantaggio è molto leggero e di nessuna importanza fondamentale. Si potrebbe facilmente fare la distinzione in altri modi; per esempio determinando che se la variabile è venuta dopo il φ che dovrebbe significare che noi ora l’esprimiamo con φx, ma se prima di φ ciò che esprimiamo con f ( φz circonflesso ); o semplicemente nel decidere di utilizzare le lettere « x ‘ , ‘ y ‘ , ‘ z ‘, in un caso , ‘ f ‘ , ‘ g ‘ , ‘ h ‘, nell’altro.

Ma , sebbene questo supposto vantaggio nella simbologia funzionale sia immaginario, c’è un motivo che lo rende assolutamente indispensabile. Prendete una certa proprietà come ‘ o che abbia una R con a , o che abbia una S con b ‘; sarebbe assolutamente impossibile rappresentare questo con un semplice simbolo ‘ φ ‘. Perché allora come potremmo definire φ? Non potremmo porre φ = Ra . v . Sb perché non sapremmo se gli spazi vuoti erano da riempire con gli stessi o differenti argomenti, e quindi se φ sia una proprietà o una relazione. Invece dobbiamo mettere φx . = . xRa . v . xSb; che spiega non cosa si intende per φ in sé stessa, ma quello che segue da qualsiasi simbolo x è l’abbreviazione di xRa . v . xSb. E questa è la ragione che rende inevitabile l’introduzione delle funzioni proposizionali. Significa semplicemente che in questo caso ‘ φ ‘ non è un nome ma un simbolo incompleto e non può essere definito in isolamento o non può essere lasciato stare da solo.

Ma questa conclusione su xRa . v . xSb non si applica a tutte le funzioni proposizionali. Se φa è una proposizione atomica a due termini, ‘ φ ‘ è il nome del termine diverso da a, e può benissimo stare da solo; così ci si potrebbe chiedere , perché scriviamo ‘ φx ‘ invece di ‘ φ ‘ anche in questo caso? La ragione di questo risiede in una caratteristica fondamentale della logica matematica, la sua estensionalità, e con questo intendo il suo interesse primario nelle classi e nelle relazioni in estensione. Ora, se in qualsiasi proposizione quale che sia cambiamo qualsiasi particolare nome con una variabile, la funzione proposizionale risultante definisce una classe; e la classe può essere la stessa per le due funzioni di forme molto diverse, in una delle quali ‘ φ ‘ è un simbolo incompleto, nell’altra un nome. Quindi la logica matematica, essendo interessata solo nelle funzioni con significato di classi, si vede che non ha la necessità di distinguere questi due tipi di funzioni, perché la differenza tra queste, sebbene del tutto importante in filosofia, non corrisponderebbe ad alcuna differenza tra le classi che essa definisce. Così perché alcuni φ sono incompleti e non possono stare da soli, tutti i φ di devono essere trattati allo stesso modo al fine di evitare complicazioni inutili, l’unica soluzione è quella di non consentire a nessuno di stare da soli.

Tale è la giustificazione pratica di Russell; ma è anche la confutazione della sua teoria, che non riesce ad apprezzare la distinzione tra le funzioni che sono nomi e quelle che sono simboli incompleti, una distinzione che, come osservato in precedenza, sebbene irrilevante per la matematica è essenziale per la filosofia. Non voglio indicare che Russell negherebbe questa distinzione; al contrario è evidente dalla seconda edizione dei Principia che l’accetterebbe; ma penso che la sua teoria attuale degli universali è il residuo della sua precedente incapacità di apprezzare questo.

Si ricorderà che abbiamo trovato due argomenti possibili per la sua teoria degli universali. Uno derivava dall’efficienza della notazione funzionale; questo chiaramente decade perché, come abbiamo visto, la notazione funzionale semplicemente trascura una distinzione fondamentale che non appare interessare il matematico, e il fatto che alcune funzioni non possono stare da sole non è la dimostrazione che tutte non possono stare da sole. L’altro argomento era per la differenza che avvertiamo tra Socrate e saggio, che corrisponde ad una differenza nel suo sistema logico tra particolari e funzioni. Proprio come Socrate determina un insieme di proposizioni, ma saggio due serie, così a determina un insieme φa , ma φz circonflesso i due insiemi φx e f ( φz circonflesso ). Ma a che cosa è dovuta questa differenza tra particolari e funzioni? Anche in questo caso semplicemente al fatto che certe cose non interessano il matematico. Chiunque fosse interessato non solo nelle classi di oggetti, ma anche nelle loro qualità, distinguerebbe tra le altre quelle funzioni che siano nomi; e se abbiamo chiamato gli oggetti di cui le loro qualità sono nomi, e denotato una qualità variabile con q, dovremmo avere non solo l’insieme φa, ma anche l’insieme più ristretto qa, e l’analoga differenza di quella tra ‘ Socrate ‘ e ​​la saggezza ’ scomparirebbe. Dovremmo avere una completa simmetria tra qualità e particolari; ognuno potrebbe avere nomi che potrebbero stare da soli, ognuno determinerebbe due insiemi di proposizioni, perché a determinerebbe gli insiemi qa e φa, dove q e φ sono variabili, e q determinerebbe gli insiemi qx e fq, dove x ed f sono variabili.

Quindi, se non fosse per l’interesse influenzato dai pregiudizi dei matematici egli poteva inventare un simbolismo che era completamente simmetrico per quanto riguarda particolari e qualità; e diventa evidente che non c’è significato nelle parole particolare e qualità; tutto quello di cui stiamo parlando riguarda due differenti tipi di oggetti, tale che due oggetti, uno di ciascun tipo, possono essere unici componenti di un fatto atomico . Essendo i due tipi in ogni modo simmetricamente correlati, nulla può avere senso nel chiamare un tipo il tipo particolare e l’altro il tipo della qualità, e queste due parole sarebbero prive di connotazione.

A questo, però, varie obiezioni potrebbero essere fatte che devono essere brevemente trattate. In primo luogo si può dire che i due termini di un certo fatto atomico devono essere collegati da un legame caratterizzante e/o da una relazione che li caratterizza, che è asimmetrica, e che distingue le loro relazioni in particolari e qualità. Contro questo direi che il rapporto di caratterizzazione è semplicemente una finzione verbale. ‘ q caratterizza a ‘ non significa né più né meno che ‘ a è q ‘ , è semplicemente una forma verbale allungata; e dal momento che la relazione di caratterizzazione non è certamente un costituente di ‘ a è q ‘ non può esserlo del tutto. Per quanto riguarda il collegamento, non riesco a capire che tipo di una cosa sarebbe, e preferisco il punto di vista di Wittgenstein che nel fatto atomico gli oggetti sono collegati tra loro senza l’aiuto di alcun mediatore 1. Ciò non significa che il fatto è semplicemente la raccolta dei suoi costituenti ma consiste nella loro unione senza alcun vincolo di mediazione. C’è un’altra obiezione in più suggerita dalla trattazione di Russell nella nuova edizione dei Principia . Egli ci dice che tutte le proposizioni atomiche sono nelle forme R1 ( x ), R2 ( x , y ), R3 ( x , y , 2 ), ecc., e così possono definire i particolari come termini che possono verificarsi in proposizioni con qualsiasi numero di termini; mentre, naturalmente, una relazione di n termini potrebbe verificarsi solo in una proposizione con n + 1 termini.

1 N.d.t. Si tratta del ripristino del Rasoio di Occam che è un punto fondamentale del sistema logico di Wittgenstein

Ma questo presuppone la sua teoria in merito alla costituzione dei fatti atomici, che ognuno deve contenere un termine di un tipo speciale, chiamato universale; una teoria che abbiamo trovato essere del tutto infondata.

La verità è che non sappiamo e possiamo sapere assolutamente nulla circa le forme delle proposizioni atomiche; noi non sappiamo se alcuni o tutti gli oggetti possono verificarsi in più di una forma di proposizione atomica; e non c’è ovviamente modo di definire una questione di questo genere. Non possiamo nemmeno dire che non ci sono fatti atomici costituiti da due termini dello stesso tipo.

Si potrebbe pensare che questo ci condurrebbe ad un circolo vizioso di contraddizioni, ma una piccola riflessione mostrerà che non lo fa, perché le contraddizioni dovute al lasciare che una funzione sia solo il proprio argomento sorgono quando assumiamo per argomento una funzione contenente una negazione che è quindi un simbolo incompleto non il nome di un oggetto.

In conclusione, cerchiamo di descrivere da questo nuovo punto di vista la procedura del logico matematico. Egli prende qualsiasi tipo di oggetti quale che siano come soggetto del suo ragionamento, e li chiama particolari, intendendo con ciò semplicemente che ha scelto questo tipo per ragionarne in merito, anche se avrebbe potuto ugualmente bene scegliere qualsiasi altro tipo e chiamarli particolari.

I risultati del sostituire i nomi di questi particolari nelle proposizioni con variabili allora li chiamerebbe le funzioni, indipendentemente dal fatto che la parte costante della funzione sia un nome o un simbolo incompleto, perché questo non fa alcuna differenza per la classe che la funzione definisce. L’incapacità di fare questa distinzione ha portato a questi simboli funzionali, alcuni dei quali sono nomi e alcuni incompleti, ad essere trattati tutti ugualmente come nomi di oggetti incompleti o proprietà, ed è responsabile di quella grande confusione nella teoria degli universali . Di tutti i filosofi solo Wittgenstein ha visto attraverso questa confusione e ha dichiarato che sulle forme delle proposizioni atomiche non possiamo sapere assolutamente nulla.

V

NOTE SULL’ARTICOLO PRECEDENTE (1926)

. . . Quando ho scritto il mio articolo ero sicuro che era impossibile scoprire le proposizioni atomiche con un’analisi vera e propria.

Di questo sono ora molto dubbioso, e non posso quindi essere sicuro che esse non possono essere scoperte essere tutte di una o dell’altra di una serie di forme che può essere espressa da R1 ( x ) , R2 ( x , y) , R3 ( x , y , z ) , ecc., nel qual caso potremmo, come Russell ha suggerito, definire i particolari come termini che possono verificarsi in proposizioni di una qualsiasi di queste forme, gli universali come termini che possono presentarsi in una sola forma. Ammetto che questo può essere trovato essere il caso, ma come nessuno può ancora essere certo di quale tipo di proposizione atomica si tratti, questo non si può affermare con certezza; e non c’è una una forte supposizione a suo favore, perché credo che l’argomento del mio articolo stabilisca che nulla del genere può essere conosciuto a priori.

E questa è una questione di una certa importanza, per i filosofi dal momento che Russell ha pensato che, anche se non sapeva in che termini ultimi le proposizioni fossero analizzabili, questi termini devono comunque essere divisibili in universali e particolari, categorie che vengono utilizzate nelle indagini filosofiche come se fosse certo a priori che a queste sarebbero applicabili. Questo certamente sembra essere derivato principalmente dal presupposto che ci deve essere una differenza tra gli oggetti fondamentali analogo a quello che avvertiamo sussistere tra certi termini come Socrate e saggio; e per vedere se questo può ragionevolmente essere sostenuto, dobbiamo scoprire che differenza c’è tra Socrate e saggio analoga alla distinzione operata nel sistema di Russell tra particolari e universali.

Se consideriamo lo sviluppo del sistema della logica di Russell, come esposto nella Premessa alla seconda edizione dei Principia Mathematica, possiamo vedere che differenza ci sia nel suo trattamento dei particolari e degli universali. Troviamo che gli universali si presentano sempre come funzioni proposizionali, che servono a determinare gli insiemi delle proposizioni, in particolare l’insieme dei valori della funzione φx, e l’insieme delle funzioni di funzione f ( φSchermata 2013-08-22 alle 18.42.59 ) (dove f è una variabile). I particolari servono anche per determinare insiemi di proposizioni, ma in questo caso vi è un unico insieme principale, l’insieme delle funzioni del particolare φa ( con φ variabile). Potremmo fare un insieme più ristretto, come Russell sottolinea, utilizzando una variabile qualità, ma non abbiamo bisogno di farlo. Ora, questa è l’unica differenza tra le funzioni di particolari e di universali nel suo sistema, e come troviamo che c’è una precisa differenza simile tra Socrate e saggio, è probabile che sia qui il nucleo della questione. Saggio, come un φx nel sistema di Russell, determina l’intervallo più ristretto di proposizioni ‘ x è saggio ‘ e quello più ampio ‘f saggio’, dove l’ultimo insieme comprende tutte le proposizioni quale che sia in cui si verifica saggio. Socrate, invece , viene utilizzato solo per determinare il più ampio insieme di proposizioni in cui si verifica in qualsiasi modo; non abbiamo un modo preciso di disfarci di un qualsiasi intervallo ristretto. Non possiamo farlo limitandolo a proposizioni in cui Socrate si presenta come soggetto, perché in ogni proposizione in cui si presenta esso può essere considerato come il soggetto: possiamo sempre considerare la proposizione come se dicesse ‘ E’ vero di Socrate che-‘. Il punto è che con Socrate la gamma più ristretta è omessa . . . .

Tuttavia questa differenza tra Socrate e saggio è illusoria, perché può essere dimostrato essere teoricamente possibile realizzare un insieme simile più ristretto per Socrate, sebbene non avessimo mai avuto bisogno di farlo. Tuttavia, una volta che questo fatto viene osservato, la differenza tra Socrate e saggio cade, e cominciamo, come Whitehead, a chiamare Socrate un aggettivo. Se pensate che tutte o quasi tutte le proposizioni sugli oggetti materiali siano funzioni verità di proposizioni sulla loro posizione negli eventi, allora, secondo il mio punto di vista, state considerando gli oggetti materiali come aggettivi di eventi. Perché questo è il vero significato della distinzione tra aggettivo e sostantivo. Non dico che la distinzione è sorta dalla riflessione esplicita circa la differenza in relazione agli insiemi di proposizioni, ma che questa differenza oscuramente avvertita è l’origine della distinzione. Il mio punto di vista è sorprendentemente confermato dall’argomentazione di Whitehead, il quale, avendo considerato gli oggetti materiali simili a saggio nel modo in questione, quindi ha dichiarato che erano aggettivi.

On a problem of formal logic – Parte III di The Foundation of Mathematics di Frank Ramsey

23 Mag

Schermata 44Propongo la mia traduzione della terza parte delle opere pubblicate di Frank Plumpton Ramsey  raccolte da R. B. Braithwaite sotto il titolo The Foundation of Mathematics.

Questa sezione riguarda la possibilità di trovare una procedura per determinare la verità o la falsità di una qualsiasi formula logica. Non intendo mettere l’accento sulle conseguenze virtuose nell’uso di questa metodologia, ma preferisco sotolineare l’originalità ed il rigore scientifico di questo lavoro se avrete cura di leggere attentamente i procedimenti logici impiegati in larghissima misura originali.

III

Su un problema di logica formale (1928)

Questo documento riguarda principalmente un caso particolare di uno dei problemi principali della logica matematica, il problema di trovare una procedura fissa per determinare la verità o falsità di una determinata formula logica. 1 Ma nel corso di questa indagine , è necessario utilizzare alcuni teoremi sulle combinazioni che hanno un interesse indipendente e sono più opportunamente posti per sé stessi nella parte iniziale.

I

I teoremi che effettivamente ci necessitano riguardano solo le classi finite, ma cominceremo con un teorema simile sulle classi infinite che è più facile da dimostrare e dà un semplice esempio del metodo della discussione.

TEOREMA A. Sia Γ una classe infinita, e μ e r siano degli interi positivi; e posto che tutte quelle sotto – classi di Γ che hanno esattamente r membri, o, come potremmo dire, posto che che tutte le r- combinazioni dei membri di Γ siano suddivisi in qualche modo in μ classi mutuamente esclusive Ci ( i = 1 , 2 , … , μ ), in modo che ogni r- combinazione sia un membro di una e una sola Ci; allora, assumendo l’Assioma delle Selezioni, Γ deve contenere una sottoclasse infinita Δ tale che tutte le r- combinazioni dei membri di Δ appartengono alla stessa Ci.

Consideriamo prima il caso μ = 2. (Se μ = 1 non vi è nulla da dimostrare.) Il teorema è banale quando r è 1, e lo dimostriamo per ogni valore di r per induzione. Supponiamo che, quindi, quando r = ρ -1 e lo deduciamo per r = ρ, che vi siano, dal momento che μ = 2 , solo due classi Ci , cioè C1 e C2.

1 Chiamato in tedesco Entscheidungsproblem ; vedi Hilbert und Ackermann , Grundzüge der Theoretischen Logik, pp 72-81.

Può accadere che Γ contenga un x1 membro e una sotto – classe infinita Γ1, non comprendente x1, tale che le ρ combinazioni, comprensive di x1 insieme a un qualsiasi ρ – 1 membri di Γ1, appartengano tutte a C1. Se è così, Γ1 può parimenti contenere un membro x2 e una sotto- classe infinita Γ2, non comprendente x2, tale che tutte le ρ combinazioni, comprensive di x2 insieme con i membri ρ -1 di Γ2, appartengano a C1. E, ancora, Γ2 può contenere un x3 e un Γ3 con proprietà simili, e così via all’infinito.

Abbiamo così due possibilità: o siamo in grado di selezionare in questo modo due sequenze infinite di membri di Γ (x1 , x2 , … , xn , … ), e di infinite sottoclassi di Γ ( Γ1 , Γ2 , . .. , Γn , … ) , in cui xn è sempre un membro di Γn – 1, e Γn una sotto- classe di Γn – 1 che non include xn , tale che tutti le ρ- combinazioni , comprensive di xn insieme ai ρ – 1 membri di Γn, appartengano a C1; altrimenti il ​​processo di selezione cadrebbe a un certo stadio, diciamo all’n -esimo, perché Γn – 1 (o se n = 1 , Γ stesso) non conterrà nessun membro xn e la sub – classe infinita Γn non comprendente xn così che tutte le ρ combinazioni, comprensive di xn insieme ai ρ – 1 membri di Γn appartengano a C1. Prendiamo a loro volta queste possibilità.

Se il processo va avanti per sempre assumiamo che Δ sia la classe ( x1 , x2 , .. , xn , … ) .Allora tutte queste x sono diverse, in quanto se r > s , xr è un membro di Γr – 1 e così di Γr – 2 , Γr – 3 , . . . , e in ultima analisi di Γs che non contiene xs. Quindi Δ è infinito. Anche tutte le ρ combinazioni dei membri di Δ appartengono a C1; perché se xs è un certo termine di una tale combinazione con almeno un suffisso s, gli altri termini ρ -1 della combinazione appartengono a Γs , e così formano con xs una ρ – combinazione appartenente a C1. Γ quindi contiene una sotto – classe Δ infinita del tipo richiesto.

Supponiamo , invece , che il processo di selezione della x e di Γ fallisca nella fase n -esima, e che y1 sia un qualsiasi membro di Γn – 1. Allora le combinazioni ( ρ -1 ) dei membri Γn – 1 – ( y1 ) possono essere suddivise in due classi mutuamente esclusive C’1 e C’2 secondo le ρ combinazioni formate aggiungendo ad essi y1 che appartiene a C1 o C2, e per il nostro teorema (A), che stiamo assumendo per vero quando r = ρ -1 ( e μ = 2 ), Γn – 1 – ( y1 ) deve contenere una sottoclasse infinita  Δ1, in modo tale che tutte le combinazioni ( ρ – 1 ) dei membri Δ1 appartengono alla stessa C’i; cioè tale che le ρ combinazioni formate unendo y1 ai membri ρ -1 di Δ1 appartengono tutti alla stessa Ci.

Inoltre, questo Ci non può essere C1, o y1 e Δ1 potrebbe essere assunto essere xn e Γn , e il nostro precedente processo di selezione non avrebbe fallito allo stadio n – esimo. Di conseguenza, le ρ combinazioni formate unendo y1 ai ρ -1 membri di Δ1 appartengono tutti a C2. Consideriamo ora Δ1 e sia y2 uno dei suoi membri. Ripetendo il precedente ragionamento Δ1 – ( y2 ) deve contenere una sottoclasse infinita Δ2 così che tutte le ρ combinazioni ottenute unendo y2 ai ρ -1 membri di Δ2 appartengono alla stessa Ci. E , ancora, questa Ci non può essere C1, o, dal momento che y2 è un membro e Δ2 una sotto – classe di Δ1 e così di Γn – 1 che include Δ1 , y2 e Δ2 avrebbe potuto essere scelto come xn e Γn e il processo di selezionare questi non avrebbe fallito nella fase n -esima. Ora sia y3 un qualsiasi membro di Δ2; allora Δ2 – ( y3 ) deve contenere una sottoclasse infinita Δ3 tale che tutte le ρ combinazioni costituite da y3 insieme con i ρ -1  membri di Δ3, appartengono alla stessa Ci, che, come prima, non può essere C1 e deve essere C2. E continuando in questo modo potremo evidentemente trovare due sequenze infinite y1 , y2, . . . , yn, . . . e Δ1 , Δ2 , . . . , Δn , . . . composti rispettivamente da membri delle sottoclassi di Γ , e tali che yn è sempre un membro di Δn-1, Δn una sotto- classe di Δn -1 che non include yn , e tutte le ρ combinazioni formate unendo yn ai ρ – 1 membri di Δn appartengono a C2; e se indichiamo con Δ la classe (y1 , y2, . . . , yn, . . .) abbiamo, dalla dimostrazione precedente, che tutte le ρ combinazioni dei membri del Δ appartengono a C2.

Quindi , in entrambi i casi , Γ contiene una sottoclasse infinita Δ del tipo richiesto, e il Teorema A è dimostrato per tutti i valori di r, purché μ = 2 . Per valori più elevati di μ lo dimostriamo per induzione; supponendolo già provato per μ = 2 e μ = ν -1, si deduce che per μ = ν .

Le r- combinazioni dei membri di Γ sono poi suddivise in ν classi Ci ( i = 1 , 2 , … , ν ) . Definiamo le nuove C’i per i = 1,2 , … , v- 1 con

C’i = Ci ( i = 1 , 2 , … , ν – 2 ) ,

C’ν – 1 = Cν – 1 + Cν

Quindi per il teorema per μ = ν – 1 , Γ deve contenere un sottoclasse infinita Δ tale che tutte le r- combinazioni dei membri di Δ appartengono alla stessa C’i . Se, in questa C’i , i ≤ ν – 2 , appartengono tutti alla stessa Ci, che è il risultato da dimostrare; altrimenti appartengono tutti alla C’ν – 1 , cioè o a Cν – 1 o Cν . In questo caso, per il teorema per μ = 2 , Δ deve contenere un infinita sottoclasse Δ’ tale che le r – combinazioni dei membri di Δ’ sia appartengono tutti o a Cν – 1 o appartengono tutti a Cν; e il nostro teorema è dimostrato.

Venendo ora a classi finite ci eviterà problemi il fare alcune convenzioni per la notazione. Lettere minuscole diversa da x e y, o in corsivo o lettere greche (per esempio n , r, μ , m ) , indicheranno sempre cardinali finiti, positivi se non diversamente specificato. Le lettere greche maiuscole (ad esempio Γ , Δ ) indicheranno le classi , e i loro suffissi indicheranno il numero dei loro membri (ad esempio Γm è una classe con m membri). Le lettere x e y rappresenteranno i membri delle classi Γ, Δ, ecc. , e i loro suffissi verranno utilizzati solo per distinguerli. Infine, la lettera C rappresenterà, come in precedenza, classi di combinazioni , e i suoi suffissi non faranno riferimento al numero dei membri, ma servono solo a distinguere le diverse classi di combinazioni considerate.

Corrispondente al Teorema A abbiamo poi

TEOREMA B. Dati qualsiasi r , n , e μ possiamo trovare un m0 tale che , se m ≥ m0 e le r- combinazioni di qualsiasi Γm sono divise in qualche modo in μ classi mutuamente esclusive Ci ( i = 1 . 2 .. μ ) , allora Γm deve contenere una sottoclasse Δn tale che tutte le r- combinazioni dei membri Δn appartengono alla stessa Ci.

Questo è il teorema di cui abbiamo bisogno nelle nostre indagini logiche, e sarebbe allo stesso tempo come avere informazioni su quanto grande deve essere preso m0 per qualsiasi dato r , n , e μ .

Non so come risolvere questo problema, e non ho dubbi che i valori di m0 ottenuti qui sotto sono molto più grandi di quanto sia necessario.

Per dimostrare il teorema cominciamo, come nel Teorema A , supponendo che μ = 2. Prendiamo poi, non il Teorema B in sé , ma l’equivalente:

TEOREMA C. Dati qualsiasi r , n , e k tali che n + k ≥ r, esiste un m0 tale che, se m ≥ m0 e le r- combinazioni di qualsiasi Γm sono divise in due classi mutuamente esclusive C1 e C2 , allora Γm deve contenere due sottoclassi mutualmente esclusive Δn e Λk tali che tutte le combinazioni formate dagli r membri di Δn + Λk che comprendono almeno un membro da Δn appartengono alla stessa Ci.

Che questo è equivalente al teorema B con μ = 2 è evidente dal fatto che, per qualsiasi r dato, il Teorema C, per n e k, asserisce più del Teorema B per n, ma meno del Teorema B per n + k.

La dimostrazione del Teorema C deve essere ottenuta per induzione matematica, e può essere convenientemente che sia presentata come una dimostrazione che è possibile definire ricorsivamente una funzione f (r , n , k) che servirà come m0 nel teorema.

Se r = 1, il teorema è evidentemente vero con m0 pari al maggiore di 2n – 1 e n + k, in modo che possiamo definire

f ( 1 , n , k) = max ( 2n – 1 , n + k) ( n ≥ 1 , k ≥ 0 ) .

Per gli altri valori di r definiamo f ( r , n , k) da formule ricorsive che coinvolgono una funzione ausiliaria g (r , n , k). Supponiamo che f (r – 1 , n , k) sia stata definita per un certo r – 1, e tutte le n, k tali che n + k ≥ r- 1 , allora la definiamo per r ponendo

f ( r,1,k ) = f ( r – 1, k -r + 2, r -2 ) +1       ( k + 1 ≥ r) ,

g ( r, 0, k) = max ( r-1, k ) ,

g (r , n , k) = f { r, 1 , g (r , n – 1 , k) } ( n ≥ 1 ) ,

f ( r , n , k) = f { r , n -1 , g (r , n , k) } ( n > 1 ) .

Si può vedere facilmente che queste formule definiscono f ( r , n , k) per tutti i valori positivi di r , n e k che soddisfano n + k ≥ r , e g ( r , n , k) per tutti i valori di r maggiori di 1, e tutti i valori positivi di n e k; e dimostreremo che il Teorema C è vero quando assumiamo m0 essere questo f ( r , n , k). Sappiamo che questo è così quando r = 1, e noi quindi lo assumeremo che per tutti i valori fino a r – 1 e lo dedurremo per r .

Quando n = 1 , e m ≥ m0 = f ( r – 1 , k – r + 2 , r – 2 ) + 1 , si può prendere qualsiasi membro x di Γm di essere unico membro di Δ1 e ci rimangono almeno f ( r – 1 , k – r + 2 , r – 2 ) membri di Γm – ( x ); le ( r – 1 ) – combinazioni di questi membri di Γm – ( x ) possono essere suddivisi nelle classi C’1 e C’2 in quanto appartengono a C1 o C2 quando x è aggiunto ad esse, e, dal nostro teorema perché r – 1 , Γm – ( x ) devono contenere due classi mutuamente esclusive Δk – r +2 , Λr – 2 tali che ogni combinazione di r -1 termini di ΔK -r +2 + Λr -2 ( in quanto uno dei suoi termini deve provenire da ΔK-r+2 , Λr -2 avendo solo r – 2 membri) appartiene alla stessa C’i . Assumendo che Λk sia questo ΔK – r +2 + Λr – 2 tutte le combinazioni costituite da x , unitamente a r -1 membri di Λk , appartengono alla stessa Ci. Il teorema è quindi vero per r quando n = 1 .

Per altri valori di n lo dimostriamo per induzione, assumendolo per n – 1 e deducendolo per n. Assumendo

m ≥ m0 = f ( r , n , k) = f { r , n – 1 , g (r , n , k ) } ,

Γm . deve , per il teorema per n -1, contenere un Δn – 1 e un Λg ( r,n , k ) tali che ogni combinazione degli r membri di Δn – 1 + Λg ( r, n , k ), almeno un termine dei quali deriva dalla Δn – 1, appartiene alla stessa Ci, ovvero a C1. Se , ora , Λg(r,n , k ) contiene un membro x e una sottoclasse Λk che non include x, tale che una qualsiasi combinazione di x e r-1 membri di Λk appartengono a C1, allora, assumendo che Δn sia Δn – 1 + ( x ) e Λk sia questo Λk , il nostro teorema è vero. Se no, non ci può essere nessun membro di Λg ( r,n , k) che ha una sotto- classe di k membri di Λg ( r,n , k) ad essa connessa in questo modo. Ma dal momento che

g (r , n , k) = f { r , 1 , g (r , n – 1 , k ) } ,

Λg ( r,n , k) deve contenere un membro x1 e una sottoclasse Λg ( r,n – 1 , k) , che non comprende x1, tale che x1 combinato con qualsiasi dei membri r – 1 di Λg ( r,n – 1 , k ) fornisce una combinazione appartenente alla stessa Ci, che non può essere C1, o x1 e qualsiasi k membri di Λg ( r,n – 1 , k) potrebbero essere presi come x andΛk di cui sopra.

Quindi le combinazioni formate da x1 insieme ogni membro r -1 di Λg ( r,n – 1 , k) appartengono tutti alla C2 . Ma adesso

g (r , n – 1 , k) = f { r , 1 , g (r , n – 2 , k ) } ,

e Λg ( r,n – 1 , k) deve contenere un x2 e un Λg ( r,n – 2 , k) , che non includono x2 , tale che le combinazioni formate da x2 e gli r -1 membri di Λg ( r,n – 2 , k) appartengono tutte alla stessa Ci, che deve, come prima, essere C2 , poiché x2 e Λg ( r,n – 2 , k) sono entrambi contenuti in Λg (r , n , k) e g ( r , n – 2 , k) ≥ k.

Continuando in questo modo possiamo trovare n termini distinti x1 , x2 , .. . , xn . e un Λg (r , 0 , k ) tale che ogni combinazione di termini r da (x1 , x2 , .. . , xn) + Λg (r , 0 , k ) appartiene a C2 , a condizione che almeno un termine della combinazione provenga da (x1 , x2 , .. . , xn) . Poiché g (r , 0 , k) ≥ k questo dimostra il nostro teorema, assumendo che Δn sia (x1 , x2 , .. . , xn) e Λk sia qualsiasi termine k di Λg (r , 0 , k) .

Il teorema C è quindi dimostrato per tutti i valori di r, n e k, con m0 pari a f ( r, n , k) . Ne consegue che, se μ = 2 , il Teorema B è vero per tutti i valori di r e n con m0 uguali a f ( r, n – r + 1 , r – 1 ) , che chiameremo anche h (r , n , 2 ) .

Per altri valori di μ dimostriamo il Teorema B per induzione, assumendo che m0 sia h ( r, n , μ ), dove

h (r , n , 2) = f ( r, n – r +1, r – 1 ) ,

h (r , n , μ) = h { r , h ( r, n, μ – 1 ) , 2} ( μ > 2) .

Perché, assumendo il teorema per μ – 1, lo dimostriamo per μ definendo nuove classi di combinazioni

C’1 = C1 ,

Schermata 2014-05-23 alle 19.09.08

Se allora m ≥ h (r , n , μ ) = h { r , h ( r , n , μ -1 ) , 2 } , per il teorema per μ = 2 , Γm deve contenere un Γh (r , n , μ -1 ) le combinazioni dei cui membri r appartengono o tutte a C’1 o tutte a C’2 . Nel primo caso non vi è più nulla da dimostrare, nel secondo dobbiamo solo applicare il teorema per μ – 1 a Γh (r , n , μ – 1 ) .

Nel caso più semplice in cui r = μ = 2 il ragionamento precedente fornisce m0 pari a h ( 2 , n , 2 ), che è facilmente dimostrato essere 2n ( n – 1 ) / 2 . Ma in questo caso vi è una semplice dimostrazione che fornisce il valore molto più basso m0 = n !, E dimostra che il nostro valore h (r , n , μ ) è del tutto eccessivo.

Perché, prendendo in primo luogo il Teorema C, siamo in grado di dimostrare per induzione con riferimento ad n che, per r = 2, possiamo assumere che m0 sia k. ( n + 1 ) ! . ( k è qui supposto maggiore o uguale a 1).

Perché questo è vero quando n = 1, dal momento che, se m ≥ 2k, di m – 1 coppie ottenute combinando un qualunque membro della Γm con gli altri, almeno k devono appartenere alla stessa Ci . Supponendo ciò, quindi, per n – 1, lo dimostriamo per n .

Se m ≥ k. ( n +1 ) ! = k ( n +1) . n ! , Γm deve, per il teorema per n -1, contenere due mutuamente esclusive sottoclassi Δn – 1 e Λk ( n +1), tali che tutte le coppie da Δn – 1 + Λk ( n +1 ), almeno un termine delle quali proviene da Δn – 1 , appartengono alla stessa Ci, ovvero a C1. Consideriamo ora i membri Λk ( n +1), in primo luogo, ci può essere uno di questi, ad esempio x, che è tale che ci sono k altri membri della Λk ( n +1) che, combinati con x danno coppie appartenenti a C1. Se è così , il teorema è vero, assumendo che Δn sia  Δn – 1 + ( x ); altrimenti sia x1 qualsiasi membro ofΛk ( n +1 ). Allora vi sono al più k- 1 altri membri di Λk ( n +1) che, combinati con x1 danno coppie appartenenti a C1, e Λk( n +1 ) – (x1) che devono contenere un Λkn qualsiasi membro del quale fornisce quando combinato con x1 una coppia appartenente a C2 . Sia x2 un qualsiasi membro di Λkn allora, dal momento che x2 e Λkn sono entrambi contenuti in Λk ( n +1), ci sono al massimo k – 1 altri membri della Λkn , che se combinati con x2 danno coppie appartenenti a C1 . Quindi Λkn -( x2 ) contiene un Λk ( n – 1) qualsiasi membro del quale combinato con x2 dà una coppia appartenente a C2. Continuando in questo modo otteniamo x1 , x2 , . . . , xn e Λk , tali che ogni coppia xi , xj e ogni coppia costituita da un xi ed un membro di Λk appartiene a C2.

Il Teorema C è quindi dimostrato.

Il Teorema B per n poi segue , con l’m0 del Teorema C per n – 1 e 1, cioè con m0 pari a n ! 1; ed è un’estensione facile mostrare che , se nel Teorema B r = 2, ma μ ≠ 2 , possiamo assumere che m0 sia n! ! ! . . . . , Dove il processo di prendere il fattoriale si verifica μ -1 volte.

1 Ma questo valore è, credo , ancora troppo elevato. Può essere facilmente abbassato leggermente anche quando seguendo la linea di ragionamento precedente, utilizzando il fatto che se k è pari è impossibile per ogni membro di una classe dispari di avere esattamente k -1 altri con i quali formi una coppia di C1, perché allora due volte il numero di queste coppie sarebbe dispari, possiamo quindi iniziare quando k è pari con un Λk ( n +1) -1 invece di un Λk ( n +1).

II

Ci occuperemo di formule logiche contenenti funzioni proposizionali variabili, ossia predicati o relazioni, che indicheremo con lettere greche φ , X , Ψ , ecc. Queste funzioni hanno come argomenti particolari indicati con x , y , z , ecc. , e ci occuperemo di funzioni con qualsiasi numero finito di termini, cioè di una qualsiasi delle forme

φ ( x ) , Χ ( x , y ) , Ψ ( x , y , z ) . ….

Oltre a queste funzioni variabili avremo una funzione costante di identità

x = y       o     = ( x , y ) .

Agendo sui valori di φ , Χ , Ψ , . . . ,  e l’= le operazioni logiche

~ significa non,

v significa o,

. significa e,

( x ) significa per tutti le x,

∃ x ) significa che c’è una x per la quale,

possiamo costruire espressioni come

[ ( x , y ) { φ ( x , y ) v x = y } ] { v ( ∃ z ) Χ ( z ) }

in cui tutte le variabili particolari sono rese ‘ apparenti ‘ dai prefissi ( x ) o ( ∃ x ), e le sole variabili reali restanti sono le funzioni φ , X , . . . Chiameremo una tale espressione formula di primo ordine.

Se tale la formula è vera per tutte le interpretazioni 1 delle variabili funzionali φ , Χ , Ψ , ecc. , noi la chiameremo valida, e se non è vera per nessuna interpretazione di queste variabili la chiameremo incoerente. Se è vera per alcune interpretazioni (anche se non per tutte) la chiameremo coerente.2

1 Per evitare confusioni noi chiamiamo una funzione costante sostituita ad un φ variabile, non un valore di φ, ma una interpretazione di essa; i valori di φ ( x , y , z) sono ottenuti sostituendo costanti particolari a x , y e z.

2 erfüllbar in tedesco .

L’Entscheidungsproblem (n.d.t.: il problema della decisione cfr. Hilbert) è di trovare un procedimento per determinare se una qualsiasi data formula è valida, o , in alternativa, se una qualsiasi data formula è coerente; perché questi due problemi sono equivalenti, dal momento che la condizione necessaria e sufficiente per una formula per essere coerente è che la sua contraddizione non sarebbe valida. Dovremo trovare più conveniente assumere il problema in questa seconda forma come indagine di coerenza. La coerenza di una formula può, ovviamente , dipendere del numero di particolari nell’universo considerato, e dovremo distinguere tra formule coerenti in ogni universo e quelle che sono coerenti solo in universi con certi particolari numeri di membri .

Ogni volta che l’universo è infinito dovremo assumere l’Assioma delle Selezioni .

Il problema è stato risolto da Behmann 1 per formule che coinvolgono solo le funzioni di una variabile, e da Bernays e Schönfinkel 2 per formule che coinvolgono due sole variabili particolari apparenti. E’ risolto qui sotto nell’ulteriore caso in cui, quando la formula è scritta in ‘ forma normale ‘, esistono un certo numero di prefissi di generalità ( x ) , ma nessuno di esistenza ( ∃ x ) .3 Con ‘ forma normale ‘ 4 qui si intende che tutti i prefissi si trovano all’inizio, con nessuna negazione tra o prima di essi, e hanno ambiti che si estendono fino al termine della formula.

1 H. Behmann , ” Beiträge zur Algebra der Logik , insbesondere zum Entscheidungsproblem, ” Math. Annalen , 86 (1922), pp 163-229 .

2 P. Bernays und M. Schönfinkel , “Zum Entscheidungsproblem der mathematiscen logik, “Math. Annalen, 99 (1928), pp. 342-372. Questi autori, tuttavia, non includono l’identità nelle formule che considerano.

3 Più avanti estendo la nostra soluzione al caso in cui ci siano anche prefissi di esistenza purché tutti questi precedano i prefissi di generalità.

4 Hilbert und Ackermann, op. cit., 63-64.

Le formule da considerare sono pertanto nella forma

(x1,x2, …, xn) F(ϕ,Χ,Ψ, …, = x1,x2, …, xn)

Dove la matrice F è una funzione verità dei valori delle funzioni ϕ,Χ,Ψ, ecc., e = per gli argomenti tratti da x1,x2, …, xn

Questo tipo di formula è interessante come il tipo generale di un sistema di assiomi interamente costituito da ‘ leggi generali ‘. 1

Gli assiomi per ordine, nello stare in relazione , e ordine ciclico sono tutti di questa natura , e noi stiamo tentando così una teoria generale della coerenza dei sistemi di assiomi di un tipo comune, se molto semplice.

Se l’identità non si verifica in F il problema è banale, poiché in questo caso se la formula è coerente o non può essere dimostrato che sia indipendente dal numero di particolari nell’universo, e abbiamo solo il facile compito di provarlo per un universo con un solo membro. 2

Ma quando si introduce l’identità il problema diventa molto più difficile, perché anche se è abbastanza evidente che, se la formula è coerente nell’universo U deve essere coerente in ogni universo con un minor numero di membri di U, ma può facilmente essere coerente in un più piccolo universo ma non in universo più ampio .

Per esempio ,

( x1 , x2 ) [ x1 = x2 v { φ ( x1 ) . ~ Φ ( x2 ) } ]

è coerente in un universo con un solo membro ma non in qualsiasi altro.

Iniziamo la nostra indagine esprimendo F in una forma particolare. F è una funzione verità dei valori di φ , Χ , Ψ , … e = per gli argomenti tratti da x1,x2, …, xn. Se φ è una funzione di r variabili ci saranno nr3 valori di φ che possono verificarsi in F e F sarà una verità funzione dei valori Σnr di φ , Χ , Ψ , … e = , che chiameremo proposizioni atomiche .

1 C.H. Langford , ” la completezza analitica degli insiemi postulati “, Proc. London Math. Soc. ( 2 ) , 25 ( 1926) , pp. 115-116 .

2 Bernays und Schönfinkel , op . cit . , p. 359 . Noi ignoriamo del tutto universi senza membri .

3 Qui e altrove i numeri sono riportati non in quanto sono rilevanti per l’argomento , ma per consentire al lettore di verificare che egli ha in mente la stessa classe di entità dell’autore.

Con riferimento a queste proposizioni atomiche Σnr ci sono 2Σnr possibilità di verità e falsità che chiameremo alternative, essendo ogni alternativa una congiunzione di Σnr proposizioni che sono o proposizioni atomiche o le loro contraddizioni. Nel costruire le alternative tutte le proposizioni atomiche Σnr devono essere utilizzate sia che si verifichino in F o meno. F può quindi essere espresso come una disgiunzione di alcune di queste alternative, cioè quelle con cui è compatibile.

E’ ben noto che tale espressione è possibile; anzi è il duale di quello Hilbert e Ackermann chiamano ‘ ausgezeichnete konjunktive Normalform (eccellente forma normale congiuntiva‘ , 1 ed è fondamentale anche nella logica di Wittgenstein. L’unica eccezione è quando F è una funzione di verità auto – contraddittoria, nel qual caso la nostra formula non è certamente coerente .

F essendo stato quindi espresso come una disgiunzione di alternative (nel nostro speciale significato della parola ), il nostro compito successivo è quello di mostrare che alcune di queste alternative possono essere in grado di essere eliminate senza incidere sulla coerenza o incoerenza della formula. Se tutte le alternative possono essere rimosse in questo modo la formula sarà incoerente; altrimenti dovremo ancora considerare le alternative che rimangono .

In primo luogo una alternativa può violare le leggi di identità contenendo parti di una qualsiasi delle seguenti forme : –

xi ≠ xi2

xi = xj.xj ≠ xi ( i ≠ j )

xi = xj.xj = xk . xi ≠ xk ( i ≠ , j ≠ k, k ≠ i) ,

o contenendo xi = xj ( i ≠ j ) e i valori di una funzione φ ed è contraddittoria ~ φ per un insieme di argomenti che diventano gli stessi quando xi è sostituito da xj [ad esempio x1 = x2 . φ ( x1 , x2 , x3) . ~ φ ( x1 , x2 , x3 ) ] .

1 op. cit . , p . 16 .

2 Noi scriviamo x ≠ y per ~ ( x = y) .

Qualsiasi alternativa che violi queste leggi deve essere sempre falsa e può evidentemente essere scartata senza compromettere la coerenza della formula. Le alternative rimanenti possono essere classificate in base al numero di x che rendono diverse, che può essere qualsiasi, da 1 fino a n.

Supponiamo che per un determinato alternativa questo numero è ν , allora possiamo trarre da questo ciò che chiameremo la corrispondente y alternativa dal seguente processo: –

Per x1, ovunque si manifesti nella data alternativa, si scrive y1; poi, se in alternativa a x2 = x1, per x2 si scrive di nuovo y1, se non si scrive y2 per x2. In generale, se xi è la data alternativa identica con qualsiasi xj con j minore di i, scrivo per xi la y precedentemente scritta per xj; altrimenti si scrive per xi , yk +1, dove k è il numero di y già introdotto. L’espressione che risulta contiene ν di y tutte diverse invece delle x di n, alcune delle quali sono identiche, e noi le chiameremo y alternative che corrispondono alla data x alternativa .

Così all’alternativa

φ ( x1 ) . ~ Φ (x2) . φ ( x3 ) . ~ φ (x4) . x1 = x3.x2 = x4.x1 ≠ x2 1

corrisponde l’alternativa y

φ ( y1 ) . ~ Φ ( y2 ) . y1 ≠ y2

Chiamiamo le due y alternative simili se contengono lo stesso numero di y e possono essere derivate l’una dall’altra permutando queste y, e noi chiamiamo due x alternative equivalenti se corrispondono a simili (o identiche) alternative y.

Così

φ ( x1 ) . ~ Φ (x2) . φ ( x3 ) . ~ φ ( x4 ) . x1 = x3.x2 = x4.x1 ≠ x2 ( α )

è equivalente a

~ Φ ( x1) . φ ( x2 ) . φ ( x3 ) . φ ( x4 ) . x1 ≠ x2.x2 = x3 = x4 ( β )

1 Prendiamo una funzione di una variabile solo per semplicità; anche per risparmiare spazio omettiamo espressioni che possono essere adottate per certe come x1 = x1 , x1 ≠ x4

in quanto corrispondono alle alternative y simili

φ ( y1 ) . ~ Φ ( y2 ) . y1 ≠ y2

~ Φ (y1) . φ ( y2 ) . y1 ≠ y2

derivabili una dall’altra scambiando y1 e y2 sebbene ( α ) e ( β ) non siano nello stesso modo derivabili permutando le x.

Ora vediamo che possiamo scartare ogni alternativa contenuta in F, qualora F contenga anche tutte le alternative equivalenti ad essa; ad esempio se F contiene ( α ) ma non ( β ), ( α ) può essere eliminata da questa. Perché omettendo le alternative chiaramente non può rendere la formula coerente se non lo era così prima; e possiamo facilmente dimostrare che, se fosse stata coerente prima, omettere queste alternative non potrebbero renderla incoerente.

Perché supponiamo che la formula sia coerente, cioè che per qualche particolare interpretazione di φ , Χ , Ψ , . . . F è vero per ogni insieme di x, e sia p un’alternativa contenuta in F, q un’alternativa equivalente a p, ma non contenuta in F.

Allora per ogni insieme di x una e una sola alternativa in F sarà (con questa interpretazione di φ , Χ , Ψ , ….) quella vera, e questa alternativa non può mai essere p. Perché se fosse p, la corrispondente alternativa y sarebbe vera per alcuni insiemi di y, e la simile alternativa y corrispondente a q sarebbe vera per qualche insieme di y ottenuto permutando questo ultimo insieme. Dando opportuni valori di x in termini di y di, q allora sarebbe vera per un certo insieme di x e F sarebbe falsa per di queste x in contrasto con le ipotesi. Quindi p non è mai la vera alternativa, e può essere omessa senza influenzare la coerenza della formula.

Quando abbiamo scartato tutte queste alternative di F, il resto cadrà in insiemi ciascuno dei quali è l’insieme completo di tutte le alternative equivalenti a una data alternativa. Ad un tale insieme di alternative x corrisponderà una serie completa di alternative y simili, e la disgiunzione di un insieme completo di alternative y simili (cioè di tutte le permutazioni di una data alternativa y ) chiameremo una forma. 1 Indicheremo una forma contenente ν di y con una maiuscola corsiva con suffisso ν, ad esempio, Aν Bν

La forza di una formula può essere rappresentata dalla seguente congiunzione, che chiameremo P:

Schermata 2014-02-05 alle 19.00.41 traduzione

dove Aν Bν 2 , ecc., sono le forme corrispondenti alle x alternative ancora rimaste in F. Se per qualsiasi ν ≤ n non ci sono tali forme, cioè se non esistono alternative a ν diversi x rimangono in F, la nostra formula implica che non vi sono oggetti come ν particolari distinti, e quindi non può essere coerente in un mondo ν o più membri.

1 Cf . Langford , op . cit . , 116-20 .

2 La notazione è parzialmente fuorviante , dal momento che Aν non ha una più stretta relazione con a Aμ rispetto a Bμ .

Ora dobbiamo definire cosa si intende dicendo che una forma è coinvolta in un’altra. Si consideri una forma Aν e prendiamo una delle alternative y in essa contenuta . Questo y alternativa è un insieme di valori di φ , Χ , Ψ , . . . e le loro contraddittorie per gli argomenti tratti dalla y1 , y2 , . . . , yν (potremmo lasciare fuori i valori di identità e differenza, dal momento che è dato per scontato che le y sono sempre differenti.) Se μ < ν possiamo selezionare un μ di questi y in qualche modo e lasciare fuori dall’alternativa tutte i termini in essa che contengono qualsiasi y non selezionati di ν-μ. Abbiamo lasciato una alternativa y in μ che possiamo rinumerare y1 , y2 , . . . yμ e possiamo descrivere la forma Eμ a cui questa nuova alternativa appartiene come coinvolta nella Aν da cui abbiamo iniziato. Partendo da un particolare y alternativo in Aν possiamo ottenere un gran numero di differenti Eμ scegliendo in modo diverso la μ di y che selezioniamo per riservarla; e da qualsiasi y alternativo in Aν cominciamo, l’Eμ che troviamo essere coinvolto in Aν sarà lo stesso .

Per esempio ,

{ φ ( y1 , y1 ) . φ ( y1 , y2 ) . φ ( y2 , y1 ) . ~ Φ ( y2.y2 ) } v { ~ Φ ( y1 , y1 ) . φ ( y1 , y2 ) . φ ( y2 , y1 ) . Φ ( y2 ,y2 ) }

è una forma A2 che coinvolge le due E1 di

φ ( y1 , y1 ) ,

~ Φ ( y1 , y1 ) .

E ‘chiaro che se per qualche insieme distinto di ν di y una forma Aν è vera, allora ogni forma Eμ coinvolta in Aν sarà vera per alcuni distinti insiemi di μ di y contenuti nel ν.

Siamo ora in grado di risolvere la coerenza o l’ incoerenza della nostra formula quando N, il numero di particolari nell’universo, è inferiore o uguale a n, il numero di x nella nostra formula. Infatti , se N ≤ n , è necessario e sufficiente per la coerenza della formula che P deve contenere una forma AN insieme con tutte le forme Eμ coinvolte in esso per ogni μ minore di N.

Questa condizione è evidentemente necessaria, dal momento che gli individui N nell’universo lo devono, assunto che y1 , y2 , . . . yN, abbiano una qualche forma AN rispetto a qualsiasi φ , Χ , Ψ , . . . ; e tutte le forme coinvolte in questo AN devono essere vere per le diverse selezioni di y, e così contenute in P se P deve essere vera per queste φ , Χ , Ψ , . . ..

Viceversa, supponiamo che P contenga una forma AN insieme a tutte le forme coinvolte in AN; allora chiamando gli N particolari nell’universo y1, y2 , . . . yN, possiamo definire che le funzioni φ , Χ , Ψ , . . . che rendono qualsiasi assegnata alternativa y in AN vera; perché ogni permutazione di questi N di y sarà un’altra alternativa in AN vera, e per qualunque sottoinsieme di y qualche alternativa y è una forma coinvolto in AN. Poiché tutte queste alternative y sono per ipotesi contenuta in P, P sarà vera per questi φ , Χ , Ψ , . . . , e la nostra formula coerente.

Quando, tuttavia, N > n il problema non è così semplice, anche se dipende chiaramente dalle AN in P tale che tutte le forme coinvolte in essa sono contenute anche in P. Possiamo definire queste  An come completamente contenute in P, e se non ci sono tali An una dimostrazione simile a quella utilizzata quando N ≤ n mostrerà che la formula è incoerente. Ma l’argomento opposto, che se c’è una AN completamente contenuta in P la formula deve essere coerente, non può essere sostenuta bene; e per procedere oltre dobbiamo introdurre una nuova concezione , la concezione di una forma che sia seriale.

Ma prima di procedere a spiegare questa idea è meglio semplificare la questione con l’introduzione di nuove funzioni. Sia φ essere una delle funzioni variabili nella nostra formula, con, ad esempio, r termini. Allora se r < n , φ si presenta in P , con tutti i suoi diversi argomenti [ad esempio φ ( y1 , y2 , … , yr )] e anche con alcuni di questi uguali [ad esempio φ ( y1 , y2 , … , yr – 1 , y1 )]; ma possiamo opportunamente eliminare i valori del secondo tipo con l’introduzione di nuove funzioni con meno argomenti di r, che, quando tutti i loro termini sono diversi, assumono i valori equivalenti a quelli di φ con alcuni dei suoi argomenti identici .

Ad esempio possiamo mettere

φ1 ( y1 , y2 , … , yr – 1 ) = φ ( y1, y2, … , yr – 1 , y1) .

In questo modo φ dà luogo ad un grande numero di funzioni con un numero minore di argomenti; noi definiamo ciascuna di queste funzioni solo per il caso in cui tutti gli argomenti sono diversi, come è garantito da questi argomenti essendo differenti i suffissi di y.

Se r > n , non vi è alcuna differenza, tranne che φ non può mai verificarsi con tutti i suoi argomenti diversi , e così è interamente sostituita dalle nuove funzioni.

Se facciamo questo per tutte le funzioni φ , Χ , Ψ , . . . , e le sostituiamo con le nuove funzioni ovunque si verifichino in P con alcuni dei loro argomenti della stessa, P conterrà una nuova serie di funzioni variabili (compresi tutte le vecchie che non hanno più di n argomenti), e questi non si presenteranno mai in P con lo stesso argomento ripetuto.

È facile vedere che questa trasformazione non influisce sulla coerenza della formula, perché, se era coerente prima, deve essere coerente in seguito, poiché le nuove funzioni devono semplicemente essere sostituite dalle loro definizioni. E se è coerente dopo deve essere state così prima, dal momento che a qualsiasi funzione del vecchio insieme deve solo essere dato per qualsiasi insieme di termini il valore dell’opportuna funzione del nuovo insieme. 1

In considerazione di questo fatto troveremo più conveniente prendere P nella sua nuova forma , e indicare il nuovo insieme di funzioni con φ0 , Χ0 , Ψ0 , . . .

1 Per esempio , se φ ( y1 , y2 , y3 ) è una funzione del vecchio insieme, abbiamo cinque nuove funzioni

φ0 ( y1 , y2 , y3) = φ ( y1 , y2 , y3 )

Χ0 ( y1 , y2 ) = φ ( y1 , y1 , y2 )

Ψ0 ( y1 , y2 ) = φ ( y1 , y2 , y1 )

π0 ( y1 , y2 ) = φ ( y2 , y1 , y1 )

ρ0 (y1) = φ ( y1 , y1 , y1 )

e ogni valore di φ è equivalente ad un valore di una, e solo una , delle nuove funzioni. Va ricordato che le nuove funzioni sono usate solo con tutti i loro argomenti diversi; perché altrimenti non sarebbero indipendenti, dal momento che dovremmo avere , per esempio, Χ0 ( y1 , y1 ) equivalente a ρ0 ( y1 ) . Ma Χ0 ( y1 , y1 ) non si verifica mai, e φ ( y1 , y1 , y1 ) è equivalente non a qualsiasi valore di Χ0 ma solo a ρ0 ( y1 ) .

Supponiamo, poi, che φ0 sia funzione di r variabili; ci saranno

n ( n – 1 ) , .. ( n -r +1 )

valori di φ0 con r diversi argomenti tratti dalla y1 , y2 , . . . , yn e ogni y alternativa deve contenere ciascuno di questi valori o suoi contrari. r ! di questi valori avrà come argomenti le permutazioni di y1 , y2 , . . . , yr . Qualsiasi altra serie di r di y può essere organizzata secondo l’ordine dei loro suffissi come yS1 , yS2 . . . , ySr , s1 < s2 < s3 . , . . . < sr e può accadere che una data un’alternativa contenga i valori di φ0 per quelle e solo quelle permutazioni di yS1 , yS2 , . . . , ySr che corrispondono (in modo ovvio ) alle permutazioni di y1 , y2 , . . . , yr , per le quali (l’alternativa) contiene i valori di φ0; ad esempio se l’alternativa contiene φ0 ( y1 , y2 , … , yr ) e φ0 ( yr , yr – 1 , … , y1 ), ma per ogni altra permutazione di y1 , y2 , . . . , yr , contiene il valore corrispondente di ~ φ0 , allora può accadere che l’alternativa contenga φ0 (yS1 ,yS2 , … ,ySr ) e φ0 ( ysr , ysr – 1 , … , yS1 ), ma per ogni altra permutazione di yS1 , yS2 , . . . , ySr , contenga il valore corrispondente di ~ φ0.

Se questo accade, non importa come venga scelto l’insieme di r di y , yS1 , yS2 , . . . , ysr, da y1 , y2 , . . . , yn , allora diciamo che l’alternativa è seriale in φ0 , 1 e se un alternativa è seriale in ogni funzione del nuovo insieme la chiameremo semplicemente seriale .

1 Così , se φ0 è un . funzione di n variabili , tutte le alternative sono seriali in φ0.

Si consideri, per esempio , la seguente alternativa, in cui possiamo immaginare φ0 e Ψ0 che derivino da una ‘vecchia’ funzione φ con le definizioni

φ0 ( yi , yk ) = φ ( yi , yk ) .

Ψ0 ( yi ) = φ ( yi , yi ).

φ0 ( y1 , y2 ) . ~ Φ0 ( y2 , y1 ) . φ0 ( y1 , y3 ) . ~ Φ0 ( y3 , y1 ) . φ0 ( y2 , y3 ) . ~ Φ0 ( y3 , y2 ) ,

Ψ0 ( y1 ) . ~ Ψ0 ( y2 ) . Ψ0 ( y3 ) .

Questa è seriale in φ0, dal momento che abbiamo sempre φ0 (yS1 ,yS2 ) . ~ Φ0 (yS2 ,yS1 ); ma non in Ψ0 , dal momento che a volte abbiamo Ψ0 (yS1 ), ma a volte ~ Ψ0 (yS1 ). Quindi non è un’alternativa seriale .

Chiamiamo una forma seriale quando contiene almeno una alternativa seriale, e ora possiamo affermare il nostro risultato principale come segue.

TEOREMA – Dato un numero finito m, dipendente da n, il numero di funzioni φ , Χ , Ψ , . . . , e il numero dei loro termini, in modo tale che la condizione necessaria e sufficiente per la nostra formula di essere coerente in un universo con m o più membri è che ci dovrebbe essere una forma seriale An completamente contenuta in P. Per coerenza in un universo con un numero di membri inferiore ad m questa condizione è sufficiente ma non necessaria .

Noi in primo luogo dimostreremo che, qualunque sia il numero N di particolari nell’universo, la condizione è sufficiente per la coerenza della formula. Se N ≤ n, questa è una conseguenza del risultato precedente, poiché , se An è contenuto totalmente in P, allora qualunque AN è coinvolto in An.

Se N > n , noi supponiamo l’universo ordinato in una serie da una relazione R. ( Se N è infinito questo richiede l’Assioma delle Selezioni.) Sia q qualsiasi alternativa seriale contenuta in An.

Se φ0 è una funzione di r termini, q conterrà i valori o di φ0 o ~ φ0 ( ma non entrambi ) per ogni permutazione di y1 , y2 , . . . , yr. Qualsiasi di tali permutazioni possono essere scritte yρ1 , yρ2 , . . . , yρr , dove ρ1 , ρ2 , . . . , ρr sono 1 , 2 , . . . , r riordinati. Facciamo un elenco di tutte quelle permutazioni ( ρ1 , ρ2 , … , ρr ) in cui q contiene i valori di φ0, e chiamiamo questo elenco Σ. Diamo ora a φ0 la costante interpretazione che φ0 (z1, z2 … , zr ) deve essere vero se e solo se l’ordine dei termini z1, z2 … , zr  nella serie R è dato da una delle permutazioni (ρ1 , ρ2 , … , ρr) contenute in Σ , nel senso che, per ogni i , zi è l’ ρi– esimo di z1, z2 … , zr, in quanto sono ordinati per R.

Supponiamo ora che y1 , y2 , . . . , yn . siano numerati nell’ordine in cui si verificano in R , cioè che nella serie R y1 è il primo di essi , y2 il secondo , e così via. Allora vedremo che, se a φ0 viene data l’interpretazione costante sopra definita, tutti i valori di φ0 e ~ φ0 in q saranno veri. Infatti , per i valori cui argomenti sono ottenuti permutando  y1 , y2 , . . . , yr ciò segue subito dal modo in cui φ0 è stato definito. Perché φ0 ( yσ1 , yσ2 , … , yσr ) è vero se e solo se l’ordine di yσ1 , yσ2 , … , yσr nella serie R è dato da una permutazione ( ρ1 , ρ2 , … , ρr) contenuta in Σ. Ma l’ordine nella serie di yσ1 , yσ2 , … , yσr è infatti dato (in base alla nostra ipotesi presente che l’ordine della y è y1 , y2 , … , yr ) da ( σ1 , σ2 , … , σr ) , che è contenuto in Σ se e solo se φ0 ( yσ1 , yσ2 , … , yσr) è contenuto in q. Quindi i valori di φ0 per gli argomenti consistenti nei primi r di y sono veri quando sono contenuti in q e falsi in caso contrario, cioè quando i corrispondenti valori di ~ φ0 sono contenuti in q.

Per l’insieme di argomenti non contenuti nei primi y di r il nostro risultato deriva dal fatto che q è seriale, vale a dire che se s1 < s2 < . . . < sr così che yS1 , yS2 , . . . , ysr sono nell’ordine dato dalla serie R, q contiene i valori di φ0 proprio per quelle permutazioni di yS1 , yS2 , . . . , ysr che corrispondono alle permutazioni di y1 , y2 , . . . , yr per cui contiene i valori di φ0, ossia nella definizione di φ0 e per l’argomento precedente, proprio per quelle permutazioni di yS1 , yS2 , . . . , ysr, che rendono φ0 vero.

Quindi tutti i valori di φ0 e ~ φ0 in q sono vere quando y1 , y2 , . . . , yn sono nell’ordine dato dalla serie R.

Se, poi, definiamo analoghe interpretazioni costanti per Χ0 , Ψ0 , ecc , e combiniamo queste con la nostra interpretazione di φ0, l’insieme di q sarà vero ammettendo che y1 , y2 , . . . , yn sono nell’ordine dato dalla serie R, e se y1 , y2 , . . . , yn sono in qualsiasi altro ordine l’alternativa vera verrà ottenuta da q opportunamente permutando le y, cioè sarà un’alternativa simile a q e contenuta nella stessa forma An. Quindi An è vero per qualsiasi insieme distinto di y1 , y2 , . . . , yn. Inoltre, per ogni insieme di distinto y1 , y2 , . . . , yn , ( ν < n) la forma vera sarà una forma coinvolta in An, e dal momento che An e tutte le forme coinvolte in esso sono contenute in P, P sarà vero per queste interpretazioni di φ0 , Χ0 , Ψ0 , . . . , e la nostra formula deve essere coerente.

Avendo così dimostrato la nostra condizione di coerenza sufficiente in qualsiasi universo, dobbiamo ora dimostrare la necessità, in ogni universo infinito o finito sufficientemente grande, e per questo dobbiamo usare il Teorema B dimostrato nella prima parte del documento .

La nostra linea di ragionamento è la seguente: dobbiamo dimostrare che, qualunque φ0 , Χ0 , Ψ0 , . . . , prendiamo , P sarà falso a meno che contenga completamente un An seriale. Per questo è sufficiente dimostrare che, dati qualsiasi φ0 , Χ0 , Ψ0 , . . . , ci deve essere un insieme di n di y per cui la forma vera è seriale 1 o , poiché una forma seriale è quella che contiene un’alternativa seriale, che ci deve essere un insieme di valori di y1 , y2 , . . . , yn per cui l’alternativa vera è seriale.

Supponiamo che tra le nostre funzioni φ0 , Χ0 , Ψ0 , . . . esistano a1 funzioni di una variabile, a2 di due variabili , . . . , e an di n variabili, e che ordiniamo l’universo con una relazione seriale R.

Gli N termini nell’universo sono divisi dalle funzioni a1 di una variabile in 2a1 classi a seconda che rendano queste funzioni vere o false, e se N ≥ 2a1k1 , possiamo trovare k1 termini che appartengono tutti alla stessa classe, vale a dire che si accordano a quelle funzioni di a1 che le rendono vere e a quelle che le rendono false, dove k1 è un numero intero positivo da assegnare successivamente.

Chiamiamo questo insieme di individui k1 Γk1 .

1Perché allora P può essere vero solo per φ0 , Χ0 , Ψ0 , . . . nel contenere completamente tale forma seriale vera.

Ora consideriamo qualsiasi due membri distinti di Γk1 , diciamo z1 e z2, e poniamo che z1 precede z2 nella serie R . Allora in relazione a qualsiasi delle funzioni a2 di due variabili, diciamo φ0, ci sono quattro possibilità . Possiamo avere

( 1 ) φ0 ( z1 , z2 ) . φ0 ( z2 , z1 ) ,

o ( 2 ) φ0 ( z1 , z2 ) . ~ φ0 ( z2 , z1 ) ,

o ( 3 ) ~ φ0 ( z1 , z2 ) . φ0 ( z2 , z1 ) ,

o ( 4 ) ~ φ0 ( z1 , z2 ) . ~ φ0 ( z2 , z1 ) .

φ0 divide così le combinazioni a due a due dei membri di Γk1 in quattro classi distinte in base a quale di queste quattro possibilità si verifica a seconda di quali di queste quattro possibilità si verifica quando si assume la combinazione come z1, z2 nell’ordine in cui i suoi termini si verificano nella serie R; e l’intero insieme delle funzioni a2 di due variabili divide le combinazioni a due a due dei membri di Γk1 in 4a2 classi, essendo le combinazioni in ciascuna classe in accordo nella possibilità che esse soddisfino con riferimento a ciascuna funzione a2. Quindi , per il Teorema B , se k1 = h ( 2 , k2 , 4a2 ), Γk1 deve contenere una sottoclasse Γk2 di k2 membri tale che tutte le coppie di Γk2 concordano nelle possibilità che soddisfino in relazione a ciascuna funzione di due variabili a2.

Continuiamo a ragionare nello stesso modo secondo la seguente forma generale: –

1 Se ar = 0 si interpretano h (r , kr , 1) come kr e rendono identici Γkr -1 e Γkr.

Consideriamo qualsiasi r distinti membri di Γkr -1; supponiamo che nella serie R essi abbiano l’ordine z1 , z2 , . . . , zr. Allora con riferimento a qualsiasi funzione di r variabili esistono 2r! possibilità in riferimento a z1 , z2 , . . . , zr, e le ar funzioni di r variabili dividono le combinazioni r ad alla volta dei membri del Γkr – 1 in 2r!ar classi. Per il Teorema B , se kr- 1 = h (r , kr, 2r!ar ) , 1 Γkr – 1 deve contenere una sottoclasse Γkr , di kr membri tale che tutte le combinazioni r alla volta dei membri del Γkr concordano nelle possibilità che esse concordino rispetto a ciascuna delle ar funzioni di r variabili.

Si procede in questo modo fino a raggiungere Γkr – 1 , tutte le combinazioni n – 1 alla volta dei cui membri concordano nelle possibilità che soddisfino in relazione a ciascuna delle an- 1 funzioni di n – 1 variabili. Noi allora stabiliamo che kn – 1 deve essere uguale a n, che determina kn -2 come h ( n – 1 , n , 2 ( n – 1 ), an – 1 ) e così via indietro fino a k1 , ogni kr – 1 essendo definito da kr .

Se, dunque , N ≥ 2a1k1 , l’universo deve contenere una classe Γkn – 1 o Γn ( dal momento che kn – 1 = n ) di n elementi che sono contenuti nella Γkr per ogni r ( r = 1 , 2 , … , n -1 ). Siano i suoi n membri, nell’ordine dato loro da R , y1 , y2 , . . . , yn . Allora per ogni r minore di n , y1 , y2 , . . . , yn sono contenuti in Γkr e tutte le r combinazioni di queste concordano nelle possibilità che soddisfino con riferimento a ciascuna funzione di r variabili. Siano ys1, ys2, …,ysr ( s1 < s2 < … < sr ) una tale combinazione , e Χ0 una funzione di r variabili. Allora ys1, ys2, …,ysr sono nell’ordine dato loro da R, e così sono y1 , y2 , . . . , yr; di conseguenza il fatto che queste due combinazioni concordano nelle possibilità che esse realizzano rispetto a Χ0 significa che Χ0 è vero per le stesse permutazioni di ys1, ys2, …,ysr come è di y1 , y2 , . . . , yr. La alternativa vera per y1 , y2 , . . . , yn è quindi seriale in Χ0, e allo stesso modo è seriale in ogni altra funzione di qualsiasi numero di variabili r 1; ed è pertanto un’alternativa seriale .

1 Abbiamo dimostrato questo, quando r < n , possiamo anche avere r = n , ma allora non c’è nulla da dimostrare in quanto in una funzione di n variabili ogni alternativa è seriale.

La nostra condizione è , dunque, dimostrata essere necessaria in qualsiasi universo di almeno 2a1k1, membri dove k1 è dato da

Schermata 2014-02-07 alle 08.12.49 traduzione

Per universi compresi tra n e 2a1k1 non abbiamo trovato una condizione necessaria e sufficiente per la coerenza della formula, ma è evidentemente possibile determinarla per tentativi se una data formula è coerente in uno qualsiasi di tali universi.

III

Considereremo ora come diventano i nostri risultati quando la nostra formula

( x1 , x2 , … , xn ) F ( φ , X , Ψ , … , = , x1 , x2 , … , xn)

contiene oltre all’identità una sola funzione φ di due variabili .

In questo caso abbiamo due funzioni φ0 , Ψ0 date da

φ0 ( yi , yk ) = φ ( yi , yk ) ( i ≠ k) ,

Χ0 ( yi ) = φ ( yi , yi ) ,

così che a1 = 1 , a2 = 1 , ar = 0 quando r > 2 . Di conseguenza,

k2 = k3 = … = kn- 1 = n e k1 = h (2, n , 4) ;

ma l’argomento alla fine della parte prima mostra che possiamo prendere invece k1 = n ! ! ! , e la nostra condizione necessaria e sufficiente per la coerenza si applica a qualsiasi universo con almeno 2 . n ! ! ! particolari.

In questo semplice caso possiamo presentare la nostra condizione in una forma più evidente come segue.

È necessario e sufficiente per la coerenza della formula che sia vera quando φ è sostituito da almeno uno dei seguenti tipi di funzioni: –

( 1 ) La funzione universale x = x . y = y .

( 2 ) La funzione nulla x ≠ x . y ≠ y .

( 3 ) Identità x = y .

( 4 ) Differenza x ≠ y .

( 5 ) Una funzione seriale che ordini l’intero universo in una serie ,ossia che soddisfa

( a) ( x ) ~ φ ( x, x ) .

( b ) ( x , y ) [ x = y v { φ ( x , y ) . ~ Φ ( x, y ) } v { φ ( x, y. ) . ~ φ ( x , y ) } ] .

( c ) ( x , y . z ) { ~ φ ( x, y ) v ~ φ ( y, z ) v φ ( x , z ) } .

( 6 ) Una funzione che ordini l’intero universo in una serie, ma che contenga anche tra gli altri membri sé stessa, cioè che soddisfi

(a ‘ ) ( x ) φ ( x , x )

e ( b ) e ( c ) come in ( 5 ) .

I tipi da ( 1 ) a ( 4) comprendono una sola funzione ciascuno; per quanto riguarda i tipi ( 5 ) e ( 6) , è irrilevante il tipo di funzione che assumiamo, dato che se si soddisfa la formula così, possiamo vedere che soddisfa tutte le altre.1

1 Un risultato ottenuto in precedenza per il tipo ( 5 ) da Langford , op. cit.

Dobbiamo dimostrare questa nuova forma della nostra condizione, mostrando che P conterrà completamente un seriale An se e solo se è soddisfatto dalle funzioni di almeno uno dei nostri sei tipi. Ora un’alternativa in  n di y è seriale in Χ0 se contiene

Schermata 2014-02-07 alle 09.22.00 traduzione

ma non altrimenti , e sarà seriale in φ0 se contiene

Schermata 2014-02-07 alle 09.22.08 traduzione

Ci sono quindi complessivamente otto alternative seriali sia per φ0 e Χ0 ottenute combinando uno di ( i) , ( ii ) con qualsiasi di ( a) , ( b ) , ( c) , ( d ); ma queste alternative seriali otto danno origine solo a sei forme seriali, poiché le alternative ( i) (b) e ( i) ( c ) possono essere ottenute l’una dall’altra invertendo l’ordine della y e quindi appartengono alla stessa forma, e così accade per le alternative ( ii ) ( b ) e ( ii ) ( c ).

E’ anche facile vedere che qualsiasi formula contenente esclusivamente una di queste sei forme seriali verrà soddisfatta da tutte le funzioni di uno dei sei tipi secondo lo schema

forma                 ( i) ( a)       (i ) ( b e c )         (i ) ( d )      ( ii ) ( a)        ( ii ) ( b e c)        ( ii ) ( d )

Tipo di funzione    1                6                         3                 4                 5                         2

e che viceversa una formula soddisfatta da una funzione di uno dei sei tipi devono contenere esclusivamente la forma corrispondente. Per esempio , una funzione del tipo 6 soddisferà l’alternativa ( i) ( b ) quando y1 , y2 , . . . , yn sono nel loro ordine nella serie determinata dalla funzione, e quando y1 , y2 , . . . , yn sono in qualsiasi altro ordine che la funzione soddisferà un’alternativa della stessa forma.

Nel linguaggio della teoria dei sistemi postulato possiamo interpretare il nostro universo come una classe K, e concludere che un sistema postulato su una base ( K , R ) costituita esclusivamente da leggi generali che coinvolgono al massimo n elementi sarà compatibile con K avente tanti  membri  quanti 2 . n ! membri se e solo se può essere soddisfatta da una R di uno dei sei tipi .

IV

In conclusione , indichiamo brevemente come estendere il nostro metodo per determinare la coerenza o l’incoerenza delle formule del tipo più generale

( ∃ z1, z2 , … , zm ) ( x1 , x2 , … , xn ) F ( φ , Χ , Ψ , … , = , z1, z2 , … , zm , x1 , x2 , … , xn)

che hanno nella forma normale entrambi i tipi di prefisso, ma soddisfano la condizione che tutti i prefissi di esistenza precedono tutti quelli di generalità .

Come prima , possiamo supporre F rappresentato come una disgiunzione di alternative e scartare quelle che violano le leggi di identità. Possiamo raggruppare quelle rimaste in base ai valori di identità e differenza per argomenti tratti completamente dalle z . Possiamo definiamo tale insieme di valori di identità e differenza con Hi ( = , z1, z2 , … , zm ) , e F può essere messo nella forma

( H1 . F1 ) v ( H2 . F2 ) v ( H3 . F3 ) v … ,

e l’intera formula è equivalente a una disgiunzione di formule.

( ∃ z1, z2 , … , zm ) { H1 ( = , z1, z2 , … , zm ) . ( x1 , x2 , … , xn ) F1 ( φ , … , = z1 , … , zm , x1 , … , xn ) } v ( ∃ z1, z2 , … , zm ) { H2 ( = , z1 , … , zm ) . ( x1 , x2 , … , xn ) F2 ( φ , …. , = , z1 , … , zm , x1 , … , xn) } v ecc

Dal momento che se una qualsiasi di queste formule è coerente è coerente la sua disgiunzione, e se la sua disgiunzione è una coerente, almeno uno dei suoi termini deve essere coerente, è sufficiente per noi di mostrare come determinare la coerenza di uno di essi, diciamo il primo.

In questo H1 ( = , z1, z2 , … , zm ) è un insieme coerente di valori di identità e differenza per ogni coppia di z. Rinumeriamo le z z1 , z2 , …. , zμ utilizzando lo stesso suffisso per ogni insieme di z che sono identici in H1, e la nostra formula diventa

( ∃ z1, z2 , … , zμ ) ( x1 , x2 , … , xn ) F1 ( φ , Χ … , = z1, z2 , … , zμ , x1 ,.. , xn ) , (i )

in cui si comprende che due di z con differenti suffissi sono sempre diverse.

Ora, supponendo che l’universo abbia almeno μ + n elementi, consideriamo le diverse possibilità per quanto riguarda le x di essere identiche alle z, e riscriviamo la nostra formula

Schermata 2014-02-07 alle 09.48.06

in cui ⊃ significa ‘ se , allora’ e

G ( φ , … , xn) = Π F1 ( φ , Χ , … , = , z1 , … zμ , θ1 , θ2 , …. θn ) ,

il prodotto essendo assunto da

θ1 = x1 , z1, z2 , . . . , zμ ,

θ2 = x2 , z1, z2 , . . . , zμ ,

……. ….

θn = xn , z1, z2 , . . . , zμ ,

e in G qualsiasi termine xi = zj è sostituito da una falsità (ad esempio xi ≠ xi ) che non comprende nessun z .

Quindi modifichiamo G introducendo nuove funzioni. In G si verificano i valori di, ad esempio φ , con argomenti alcuni dei quali alcuni sono z e alcuni x; da questi si definiscono le funzioni delle x solo semplicemente considerando le z come costanti, e chiamiamo queste nuove funzioni φ0 , Χ0 , . . .. Sostituiamo i valori di φ , Χ , Ψ , . . . , che non comprendono nessuna x tra i loro argomenti, con le proposizioni costanti p , q , . . . Gli unici valori di identità in G sono nella forma xi = xj e lasciamo solo questi. Supponiamo che da questo processo G diventi

L ( φ , Χ , Ψ , … , φ0 , Χ0 , …. , p , q , … , = , x1 , x2 , … , xn) .

Allora la coerenza della formula ( i) in un universo di N termini è evidentemente equivalente alla coerenza in un universo di N – μ termini della formula

( x1 , x2 , … , xn ) L ( φ , Χ , Ψ , … , φ0 , Χ0 , …. , p , q , … , = , x1 , x2 , … , xn)

Ma questa è una formula del tipo precedentemente affrontato, ad eccezione delle proposizioni variabili p , q , . . . , che sono facilmente eliminate considerando i diversi casi della loro verità e falsità, essendo la formula coerente se è coerente in uno di questi casi .

Mathematical Logic – Parte II di The Foundation of Mathematics di Frank P. Ramsey

18 Mag

Come si suonano gli elettoriPropongo la mia traduzione della seconda parte delle opere pubblicate di Frank Plumpton Ramsey curate da R.B. Braithwaite con il titolo The Foundation of Matematics

LOGICA MATEMATICA ( 1926)

Mi è stato chiesto di parlare degli sviluppi nella Logica Matematica fin dalla pubblicazione dei Principia Mathematica, e penso che sarebbe stato più interessante se, invece di descrivere i vari precisi miglioramenti nel dettaglio, parlassi a grandi linee sul lavoro che è stato fatto con metodi completamente diversi, e che sostiene di sostituire del tutto la posizione assunta da Whitehead e Russell sulla natura della matematica ed i suoi fondamenti logici .

Permettetemi di cominciare ricordando quale è il punto di vista Whitehead e Russell: questo è che la matematica è parte della logica formale, che tutte le idee della matematica pura possono essere definite in termini che non sono tipicamente matematici, ma coinvolti nel pensiero complicato di una qualsiasi descrizione, e che tutte le proposizioni della matematica possono essere dedotte da proposizioni della logica formale, come ad esempio che se p è vero, allora o p o q è vero. Questo punto di vista mi sembra di per sé plausibile, così non appena la logica è stata sviluppata oltre il suo antico nucleo sillogistico, dovremo aspettarci di avere oltre alle forme ” Tutti gli uomini sono mortali ‘, ‘ Alcuni uomini sono mortali ‘, le forme numeriche ‘ Due uomini sono mortali ‘e’ Tre uomini sono mortali’, e i numeri dovranno essere inclusi nella logica formale.

Frege fu il primo a sostenere che la matematica faceva parte della logica, e a costruire una teoria dettagliata su tali basi.

Ma è entrato in collisione con le famose contraddizioni della teoria degli aggregati, e sembrava che le conseguenze contraddittorie potessero essere dedotte dalle sue proposizioni primitive. Whitehead e Russell sfuggirono a questo destino introducendo la Teoria dei Tipi , di cui è impossibile dare qui un resoconto adeguato. Ma una delle sue conseguenze deve essere spiegata se gli sviluppi successivi devono essere comprensibili.

Supponiamo di avere una serie di caratteristiche date come tutte le caratteristiche di un certo tipo, diciamo A, allora possiamo informarci su qualsiasi cosa, se ha una caratteristica del tipo A.

Se la possiede, questa sarà un’altra caratteristica di essa, e si pone la questione se questa caratteristica, la caratteristica di avere una caratteristica del tipo A , possa essere del tipo A, visto che presuppone la totalità di tali caratteristiche. La teoria dei tipi sostiene che non si può, e che possiamo solo sfuggire alla contraddizione dicendo che si tratta di una caratteristica di ordine superiore, e non può essere inclusa in qualsiasi asserzione riguardante tutte le caratteristiche di ordine inferiore. E più in generale, che ogni asserzione riguardante tutte le caratteristiche deve essere considerata totalmente nel senso d’un certo ordine . Questo sembrava di per sé plausibile, e anche l’unico modo per evitare certe contraddizioni che risultano dal confondere questi ordini di caratteristiche. Whitehead e Russell inoltre sostengono che le affermazioni sulle classi o aggregati sono da considerarsi veramente riguardanti le caratteristiche che definiscono le classi (una classe essendo sempre definita come la classe degli oggetti che possiedono una certa caratteristica), in modo che ogni affermazione su tutte le classi sarà effettivamente su tutte le caratteristiche, e sarà soggetta alle stesse difficoltà per quanto riguarda l’ordine di queste caratteristiche .

Tale teoria ci permette facilmente di evitare le contraddizioni della Teoria degli Aggregati , ma ha anche la sfortunata conseguenza di invalidare un tipo comune e importante di ragionamento matematico, il tipo di ragionamento con cui in ultima analisi stabiliamo l’esistenza del limite superiore di un aggregato, o l’esistenza del limite di una successione monotona limitata. Si è soliti dedurre queste proposizioni dal principio della sezione di Dedekind, che se i numeri reali sono divisi nel loro complesso in una classe superiore e una classe inferiore, ci deve essere un numero che le separa che appartiene o meno della classe superiore o il più grande della classe inferiore. Questo a sua volta è dimostrato dal considerare i numeri reali come sezioni dei razionali; le sezioni dei razionali sono un tipo particolare di classi dei razionali, e quindi una affermazione sui numeri reali sarà un’affermazione su un tipo di classi di razionali, cioè di una sorta di caratteristiche dei razionali, e le caratteristiche in questione dovranno essere limitate ad essere di un certo ordine.

Ora supponiamo di avere una aggregato E di numeri reali; questo sarà una classe di caratteristiche di razionali. ξ , il limite superiore di E, è definito come una sezione dei razionali che è la somma dei membri di E; cioè ξ è una sezione i cui membri sono tutti quei razionali che sono membri di qualsiasi membro di E, cioè, tutti quei razionali che hanno la caratteristica di avere una delle caratteristiche che che li rende membri della E. Così il limite superiore ξ è una sezione la cui caratteristica che lo definisce è quella di ordine superiore a quella dei membri di E. Quindi se tutti i numeri reali rappresentano tutte le sezioni dei razionali definiti da caratteristiche di un certo ordine, il limite superiore sarà, in generale, una sezione dei razionali definiti da una caratteristica di ordine superiore, e non sarà un numero reale.

Ciò significa che l’analisi , come ordinariamente intesa è interamente fondata su una sorta di fallace argomentazione, che se applicata in altri campi porta a risultati auto contraddittori.

Whitehead e Russell  hanno tentato di evitare questa sfortunata conseguenza della teoria dei tipi introducendo l’Assioma di Riducibilità, che asserisce che, per qualsiasi caratteristica di ordine superiore vi era una caratteristica equivalente di ordine inferiore – equivalente, nel senso che tutto ciò che ha l’una l’ha l’altra, in modo che esse definiscono la stessa classe. Il limite superiore, che abbiamo visto era una classe di razionali definita da una caratteristica di ordine superiore, verrebbe quindi ad essere definita anche dalla caratteristica equivalente di ordine inferiore, e sarebbe un numero reale. Purtroppo l’assioma non è certamente in sé evidente, e non vi è alcun motivo per supporlo vero. Se fosse vero questo sarebbe solo, per così dire, un felice accidente, e non sarebbe una verità logica come le altre proposizioni primitive .

Nella seconda edizione dei Principia Mathematica, il cui primo volume è stato pubblicato lo scorso anno, Russell ha mostrato come l’induzione matematica, per il quale l’Assioma di Riducibilità sembrava anche essere richiesto, può essere stabilita senza di esso, ma non offre alcuna speranza di successo simile con la Teoria dei Numeri Reali, per i quali il metodo ingegnoso utilizzato per l’insieme dei numeri non è disponibile. La questione è quindi lasciata in condizioni profondamente insoddisfacenti.

Ciò è stato sottolineato da Weyl, che ha pubblicato nel 1918 un libretto intitolato Das Kontinuum, in cui ha respinto l’Assioma di Riducibilità e ha accettato la conseguenza che l’analisi ordinaria era sbagliata. Ha mostrato , tuttavia, che i vari teoremi, come il Principio Generale di Convergenza di Cauchy, poteva ancora essere dimostrato.

Da allora Weyl ha cambiato il suo punto di vista e divenne un seguace di Brouwer, il leader di quella che viene chiamata la scuola intuizionista,la cui dottrina principale è la negazione della Legge del Terzo Escluso, che ogni proposizione è vera o falsa. 1 Questo è negato apparentemente perché è ritenuto impossibile conoscere un certo oggetto a priori, e altrettanto impossibile conoscerlo per esperienza, perché se non sappiamo né se sia vero o che sia falso, non possiamo verificare se sia vero o falso. Brouwer rifiuterebbe di essere d’accordo che o piove o non piove, a meno che non avesse guardato per vederlo.

1 Per esempio, come ha detto il Cavaliere Bianco: ‘ Tutti quelli che mi sentono cantare – o o gli vengono le lacrime agli occhi, oppure – ‘ . ‘ Altrimenti cosa ? ‘ Disse Alice, perché il Cavaliere aveva fatto una improvvisa pausa . ‘ Oppure no, sapete. ‘

Anche se è certamente difficile dare una spiegazione filosofica della nostra conoscenza delle leggi della logica, non posso persuadermi che non so per certo che la Legge del Terzo Escluso è vera; naturalmente, non può essere provata, anche se Aristotele ha dato il seguente ingegnoso argomento a suo favore. Se una proposizione è né vera né falsa, la chiameremo dubbia; ma allora se la Legge del Terzo Escluso fosse falsa, non sarebbe necessario che fosse dubbia o non dubbia, così avremo non solo tre possibilità, ma quattro, che è vera, che è falsa, che sia dubbia, e che non sia né vera, né falsa , né dubbia. E così via ad infinitum.

Ma se si rispondesse ‘ Perché no ? ‘, non ci sarebbe chiaramente più nulla da dire, e io non vedo come una base comune possa essere trovata da ciò per discutere la questione. I casi in cui Brouwer pensa la Legge del Terzo Escluso sia falsa sono quelli in cui, come dovrei dire, non potremmo dire se la proposizione sia vera o falsa; per esempio, 2√2 è razionale o irrazionale ? Non lo possiamo dire, ma Brouwer direbbe che non sia nessuno dei due. Non possiamo trovare due interi m , n modo che m/n = 2√2; quindi non è razionale: e non possiamo dimostrare che è impossibile trovare tali numeri interi; quindi, non è irrazionale.

Non riesco a vedere che la questione non è risolta dicendo che è o razionale o irrazionale , ma non possiamo dire quale sia. La negazione . La Legge del Terzo Escluso rende illegittimo il ragionamento chiamato dilemma, in cui viene mostrato che qualcosa segue da una ipotesi e anche dalla contraddizione di questa ipotesi, e si conclude che è vero incondizionatamente. Così Brouwer non è in grado di giustificare la gran parte della matematica comune, e le sue conclusioni sono ancora più scettiche rispetto a quelle della prima teoria di Weyl.

La seconda la teoria di Weyl è molto simile a quella di Brouwer, ma lui sembra negare la Legge del Terzo Escluso per motivi differenti, e in modo meno generale. Egli non sembra negare che ogni proposizione è vera o falsa, ma nega la legge derivata che o ogni numero ha una proprietà, o almeno un numero non l’ha. Spiega la sua negazione prima di tutto per i numeri reali nel modo seguente. Un numero reale è dato da una sequenza di numeri interi, per esempio, come decimale infinito; questa sequenza si può concepire come generata da una regola o da azioni successive di scelta. Se ora diciamo che c’è un numero reale o una sequenza avente una certa proprietà, questo può solo significare che abbiamo trovato una legge che ne fornisce una; ma se diciamo tutte le sequenze hanno una proprietà, noi intendiamo che l’avere la proprietà è parte dell’essenza di una sequenza, e quindi appartiene a sequenze che derivano non solo da regole ma da atti di libera scelta. Quindi non è vero che o tutte le sequenze hanno la proprietà o c’è una sequenza che non l’ha. Perché il significato di sequenza è differente nei due casi.

Ma non vedo perché non dovrebbe essere possibile usare la parola in modo coerente. Comunque sia, nulla di simile può essere addotto sull’insieme dei numeri che non sono definiti da sequenze, e così un altro motivo più fondamentale viene proposto per negare la Legge del Terzo Escluso. Il fatto è che le proposizioni generali esistenziali non sono affatto realmente proposizioni. Se dico ‘ 2 è un numero primo ‘ , questo è un giudizio vero e autentico che asserisce un fatto; ma se io dico ‘ C’è un numero primo ‘ o ‘ Tutti i numeri sono primi ‘ , io non esprimo affatto un giudizio. Se Weyl dice, la conoscenza è un tesoro, la proposizione esistenziale è un documento che attesta l’esistenza di un tesoro, ma senza dire dove esso si trova.

Possiamo solo dire ‘ Vi è un numero primo ‘ quando abbiamo precedentemente detto ‘Questo è un numero primo ‘ e dimenticato o scelto di ignorare quale particolare numero fosse. Quindi non è mai lecito dire ‘ C’è una così e così ‘ se non siamo in possesso di una costruzione per trovarne realmente una. Di conseguenza, la matematica deve essere considerevolmente modificata; per esempio, è impossibile avere una funzione di una variabile reale con più di un numero finito di discontinuità. Sul fondamento su cui poggia questo, vale a dire il punto di vista che le proposizioni esistenziali e generali non sono giudizi veri, tornerò più avanti.

Ma prima devo dire qualcosa del sistema di Hilbert e dei suoi seguaci, che mira a porre fine a tale scetticismo una volta per tutte. Questo viene fatto per quanto riguarda matematica superiore come manipolazione di simboli privi di significato secondo regole fisse. Iniziamo con alcune righe di simboli chiamati assiomi: da questi possiamo ricavarne altri sostituendo alcuni simboli chiamati costanti con gli altri chiamati variabili, e procedendo dalla coppia di formule p, se p allora q, alla formula q.

La matematica in senso proprio è pertanto considerata come una sorta di gioco, giocato con segni senza significato sulla carta un po’ come il filetto; ma oltre a questo ci sarà un altro soggetto chiamato metamatematica, che non è privo di significato, ma si compone di affermazioni vere circa la matematica, che ci dice che questa o quella formula può o non può essere ottenuta dagli assiomi secondo le regole di deduzione. Il teorema più importante di metamatematica è che non è possibile dedurre una contraddizione dagli assiomi, dove per contraddizione si intende una formula con un certo tipo di forma, che può essere assunta essere 0 ≠ 0 . Comprendo che Hilbert ha dimostrato questo, e ha così eliminato la possibilità di contraddizioni e lo scetticismo basato su di esse.

Ora, qualunque altra cosa un matematico stia facendo, sta certamente facendo segni sulla carta , e così questo punto di vista è costituito da nient’altro che verità; ma è difficile supporre tutta la verità. Ci deve essere una ragione per la scelta di assiomi, e qualche ragione per cui il segno particolare 0 ≠ 0 è considerato con tale orrore. Questo ultimo punto può tuttavia essere spiegato dal fatto che gli assiomi permetterebbero di dedurre qualsiasi cosa da 0 ≠ 0, in modo che se 0 ≠ 0 potesse essere provato, qualsiasi cosa potrebbe essere dimostrata, il che porrebbe fine al gioco per sempre, il che sarebbe molto noioso per i posteri. Inoltre, ci si può chiedere se sia davvero possibile dimostrare che gli assiomi non portino a contraddizione, dal momento che nulla può essere dimostrato a meno che si adottino alcuni principi per certi e assunti in modo che non portino a contraddizione. Questa obiezione è ammessa, ma si è sostenuto che i principi utilizzati nella prova metamatematica che gli assiomi della matematica non portano a contraddizioni, sono così ovviamente veri che nemmeno gli scettici possano dubitarne. Perché tutti questi non si riferiscono a cose astratte o infinitamente complesse, ma a segni sulla carta, e anche se qualcuno può dubitare che una sottoclasse di un certo tipo di serie infinite debba avere un primo termine, nessuno può dubitare che se = si verifica in una pagina, vi è un punto della pagina dove questo si verifica per la prima volta.

Ma, concedendo tutto questo, deve comunque essere domandato quale uso o valore vi sia in questo gioco che il matematico gioca, se sia davvero un gioco e non una forma di conoscenza; e l’unica risposta che viene data è che alcune formule del matematico hanno o possono essere assegnati significati, e che se queste possono essere provate nel sistema simbolico il loro significato sarà vero.

Perché Hilbert condivide il parere di Weyl che le proposizioni generali ed esistenziali sono prive di significato, in modo che le uniche parti della matematica che significano qualcosa sono le asserzioni particolari sugli interi finiti, come ‘ 47 è un numero primo ‘ e congiunzioni e disgiunzioni di un numero finito di tali affermazioni come ‘ C’è un numero primo tra 50 e 100 ‘ , che può essere considerata nel senso ‘ o ​​51 è un numero primo o 52 è un numero primo, ecc. , fino a, o 99 è un numero primo ‘. Ma, come tutte queste proposizioni della semplice aritmetica possono essere facilmente dimostrate senza utilizzare affatto la matematica superiore, questo uso per questo non può essere di grande importanza . E sembra che, anche se il lavoro di Hilbert fornisce un nuovo e potente metodo, che egli ha applicato con successo al problema del Continuo, come filosofia della matematica difficilmente può essere considerata adeguata .

Vediamo allora che queste autorità, per quanto grandi siano le differenze tra di loro, sono d’accordo che l’analisi matematica , come ordinariamente insegnata non possa essere considerata come un insieme di verità, ma è o falsa o al massimo un gioco senza significato con dei segni sulla carta; e questo significa, penso , che i matematici in questo paese dovrebbe porre una certa attenzione alle loro opinioni, e cercare di trovare il modo di affrontare la situazione .

Consideriamo quindi che tipo di difesa può essere fatta per la matematica classica , e la filosofia di Russell su di essa.

Dobbiamo iniziare con quella che sembra essere la questione cruciale, il significato di proposizioni generali ed esistenziali, su cui Hilbert e Weyl hanno sostanzialmente la stessa opinione. Weyl dice che una proposizione esistenziale non è un giudizio, ma un’astrazione di un giudizio, e che una proposizione generale è una sorta di assegno che può essere incassato per un vero e proprio giudizio quando si verifica un caso particolare di questa proposizione.

Hilbert, meno metaforicamente, dice che sono proposizioni ideali, e svolgono la stessa funzione in logica come gli elementi ideali in varie branche della matematica. Egli spiega la loro origine in questo modo; una vera e propria proposizione definita come ‘Esiste un numero primo tra 50 e 100’ , noi la scriviamo ‘ Vi è un numero primo che è superiore a 50 e inferiore a 100 ‘ , che sembra contenerne un parte , ‘ 51 è un numero primo , o 52 è un numero primo , ecc. , ad inf., ‘ e così sarebbe una somma logica infinita, che, come una somma algebrica infinita, è prima di tutto senza senso, e le può essere solo dato un significato secondario a determinate condizioni di convergenza. Ma l’introduzione di queste forme senza significato semplifica così le regole di inferenza che è conveniente serbarle, considerandole come ideali, per ciò in cui un teorema coerenza debba essere provato.

In questa punto di vista della questione mi sembrano esserci diverse difficoltà. In primo luogo è difficile vedere quale uso per questi ideali si possa supporre vi sia; perché la matematica propriamente detta sembra essere ridotta all’aritmetica elementare, non essendo neppure ammessa l’algebra, perché l’essenza dell’algebra è quello di fare affermazioni generali. Ora, qualsiasi formula di aritmetica elementare può essere facilmente provata e dimostrata senza l’utilizzo della matematica superiore, che, se se ne suppone l’esistenza solo per la sola aritmetica, sembra del tutto inutile. In secondo luogo, è difficile vedere come la nozione di un ideale può respingere la possibilità di una conoscenza generale. Perché la giustificazione degli ideali sta nel fatto che tutte le proposizioni che non contengono ideali possono essere dimostrate per mezzo di essi che sono vere. E così la metamatematica di Hilbert , che è accettato essere genuina verità, è destinata a consistere di proposizioni generali su tutte le possibili dimostrazioni matematiche, che , anche se ogni dimostrazione è una costruzione finita, potrebbero essere in numero infinito. E se, come dice Weyl, una proposizione esistenziale è un documento che attesta l’esistenza di un tesoro di conoscenza, ma non dice dove si trova, non vedo come si spiega l’utilità di un tale documento, se non presupponendo il suo destinatario capace della conoscenza esistenziale che c’è un tesoro da qualche parte.

Inoltre, anche se il ragionamento di Hilbert potesse essere accettato finché limitiamo la nostra attenzione alla matematica, non vedo come potrebbe essere reso plausibile per quanto riguarda la conoscenza in generale. Quindi, se ti dico ‘ possiedo un cane’, sembra che tu ottenga la conoscenza di un fatto; banale, ma sempre conoscenza.

Ma ‘ io possiedo un cane ‘ deve essere messo in simbolismo logico come ‘ Esiste qualcosa che è un cane e posseduta da me ‘ , così che la conoscenza è la conoscenza di una proposizione esistenziale, che copre la possibile infinita gamma degli ‘oggetti’. Ora si potrebbe forse sostenere che la mia conoscenza che possiedo un cane derivi nel certo modo che Hilbert descrive dal mio scindere non correttamente quello che sembra essere parte di una proposizione finita, come ‘ Rolf è un cane e posseduto da me ‘, ma la vostra conoscenza non può assolutamente essere spiegata in questo modo, perché la proposizione esistenziale esprime tutto ciò che hai sempre conosciuto, e probabilmente tutto quello che sempre conoscerai sulla questione.

Infine, anche i fatti apparentemente particolari dell’aritmetica semplice aritmetica mi sembrano essere in verità generali. Perché cosa sono questi numeri, che cosa riguardano ? Secondo Hilbert segni sulla carta costruita con i segni 1 e + .

Ma questo ragionamento mi sembra inadeguato, perché se avessi detto ‘ ho due cani ‘, anche questo ti direbbe qualcosa; tu capiresti la parola ‘ due ‘, e l’intera frase potrebbe essere resa qualcosa come ‘ ci sono x e y , che sono i miei cani e non sono identici uno con l’altro ‘. Questa affermazione sembra coinvolgere l’ idea di esistenza, e di non riguardare segni sulla carta; così che io non vedo che possa essere seriamente sostenuto che un numero cardinale che risponde alla domanda ‘ Quanti ? ‘ sia solo un segno sulla carta. Se allora prendiamo uno di questi singoli fatti aritmetici, come 2 + 2 = 4, questo mi sembra che significhi ‘ Se i p sono in numero di due , e i q anche, e nulla è sia contestualmente un p ed un q, allora il numero di cose che sono o p o q sono quattro.’

Perché questo è il senso in cui dobbiamo prendere 2 + 2 = 4 , al fine di utilizzare, come noi facciamo, per dedurre dal fatto che ho due cani e due gatti ‘ che ho quattro animali domestici. Questo fatto apparentemente particolare, 2 + 2 = 4, quindi contiene diversi elementi di generalità ed esistenza, in primo luogo perché i p e q sono caratteristiche assolutamente generali, e in secondo luogo perché le parti della proposizione, come ‘ se i p sono in numero di due ‘, coinvolgiamo, come abbiamo visto, l’ idea di esistenza.

È possibile che l’intera asserzione che proposizioni generali ed esistenziali non possono esprimere giudizi veri o che la conoscenza è puramente verbale; che ciò sia semplicemente deciso per sottolineare la differenza tra proposizioni particolari e generali rifiutando di utilizzare le parole giudizio e conoscenza in connessione con la quest’ultima. Questo, tuttavia, sarebbe un peccato, perché tutte le nostri associazioni naturali con le parole giudizio e conoscenza si adattano alle proposizioni generali ed esistenziali così come fanno con quelle particolari; perché in entrambi i casi possiamo sentire maggiore o minore grado di convinzione sulla questione, e in entrambi i casi possiamo essere in un qualche senso nel giusto o in errore. E il suggerimento che implica, che la conoscenza generale e esistenziale esiste semplicemente per il gusto della conoscenza individuale, mi sembra del tutto falso. Nel teorizzare ciò quello che noi principalmente ammiriamo è la generalità, e nella vita ordinaria può essere abbastanza sufficiente conoscere la  proposizione esistenziale che ci sia un toro da qualche parte in un certo campo, e non ci può essere alcun ulteriore vantaggio nel sapere che è questo toro qui nel campo, anziché semplicemente un toro da qualche parte .

Come allora spieghiamo le proposizioni generali ed esistenziali ? Non credo che possiamo fare di meglio che accettare il punto di vista che è stato proposto da Wittgenstein come conseguenza della sua teoria delle proposizioni in generale. Egli le spiega facendo riferimento a ciò che può essere chiamato proposizioni atomiche, che asseriscono il più semplice tipo possibile di fatto, e può essere espresso senza usare nemmeno implicitamente eventuali termini logici come o , se , tutti, alcuni . ‘Questo è rosso ‘ è forse un esempio di una proposizione atomica. Supponiamo ora che abbiamo, diciamo, n proposizioni atomiche; per quanto riguarda la loro verità o falsità , ci sono al massimo 2n possibilità mutualmente esclusive.

Chiamiamo queste le possibilità di verità delle n proposizioni atomiche; allora possiamo prendere qualsiasi sotto – insieme di queste possibilità di verità e affermare che esiste una possibilità di questo sotto – insieme, che è, in realtà, soddisfatta. Possiamo scegliere questo sotto-insieme di possibilità in cui affermare la verità risulta in

Schermata 2014-02-04 alle 11.46.42

 

modi: e queste saranno tutte le proposizioni che possiamo costruire su queste n proposizioni atomiche. Così, per fare un semplice esempio, ‘ Se p , allora q ‘ esprime accordo con le tre possibilità, che sia p sia q siano vere, che p è falso e q vero, e che p è falso e q falso, e nega la rimanente possibilità che p è vero e q falso.

Si può facilmente vedere che da questo punto di vista c’è una ridondanza in tutti notazioni logiche ordinarie, perché possiamo scrivere in molti modi diversi ciò che è essenzialmente la stessa proposizione, esprimendo accordo e disaccordo con gli stessi insiemi di possibilità.

Wittgenstein sostiene che tutte le proposizioni esprimono accordo e disaccordo con possibili verità delle proposizioni atomiche, o , come diciamo, sono funzioni verità di proposizioni atomiche; anche se spesso le proposizioni atomiche in questione non vengono enumerate, ma definite come tutti i valori di un certa funzione proposizionale. Così la funzione proposizionale ‘ x è rosso ‘ determina un insieme di proposizioni che sono i suoi valori, e noi possiamo asserire che tutti o almeno uno di questi valori sono veri nel dire ‘ Per tutte le x , x è rosso ‘ e ‘ C’è una x tale che x è rossa ‘ , rispettivamente. Vale a dire, se si potessero enumerare i valori di x come a, b ​​. . . z , ‘ Per tutte le x , x è rosso ‘ sarebbe equivalente alla proposizione ‘ a è rosso e b è rosso . . . e z è rosso’. E’ chiaro , naturalmente, che lo stato d’animo di un uomo che usa una espressione differisce per molti aspetti da quella di un uomo che usa l’altra, ma quello che potrebbe essere chiamato il significato logico della dichiarazione, il fatto che si afferma essere, è lo stesso nei due casi.

E’ impossibile discutere adesso tutti gli argomenti che potrebbero essere usati contro questo punto di vista, ma qualcosa deve essere detto a proposito della tesi di Hilbert, che se la variabile ha un numero infinito di valori, se, cioè, ci sono un infinito numero di oggetti nel mondo di tipo logico in questione, abbiamo qui una somma logica infinita o un prodotto infinito che, come una somma algebrica infinita o un prodotto, è dall’inizio priva di senso e le può essere dato un significato solo in modo indiretto. Questo mi sembra poggiare su una falsa analogia; la somma logica di un insieme di proposizioni è la proposizione di cui almeno un termine dell’insieme è vero, e non sembra avere importanza se l’insieme è finito o infinito.

Non è come una somma algebrica la cui finitezza è essenziale, dal momento che questa viene estesa passo dopo passo dalla somma di due termini .

Dire che tutto ciò che coinvolge potenzialmente un’infinito di qualsiasi tipo deve essere priva di significato è dichiarare in anticipo che una vera teoria degli aggregati è impossibile.

Oltre ad una semplice considerazione di proposizioni esistenziali e generali, la teoria di Wittgenstein risolve un’altra questione di primaria importanza spiegando con precisione la natura peculiare delle proposizioni logiche. Quando Russell prima dice che la matematica potrebbe essere ridotta alla logica, il suo punto di vista della logica era che consisteva di tutte le assolutamente generali proposizioni vere, proposizioni  cioè, che non contenevano nessuna costante materiale (in contrapposizione a quelle logiche). In seguito ha abbandonato questo punto di vista, perché era chiaro che era richiesta qualche ulteriore caratteristica oltre alla generalità. Perché sarebbe possibile descrivere tutto il mondo, senza menzionare alcuna cosa particolare, e chiaramente qualcosa potrebbe per caso essere vera di qualsiasi cosa che non avesse il carattere di necessità che appartiene alle verità della logica.

Se, poi, vogliamo capire quale logica, e così secondo il punto di vista di Russell quale matematica sia, dobbiamo cercare di definire questo ulteriore caratteristica che può essere vagamente chiamata necessità, o da un altro punto di vista tautologia. Ad esempio, ‘ p è o vero o falso ‘ può essere considerata sia una verità necessaria, o come una semplice tautologia . Questo problema viene risolto incidentalmente dalla teoria delle proposizioni di Wittgenstein. Le proposizioni, abbiamo detto, esprimono accordo e disaccordo con le possibilità di verità di proposizioni atomiche. Date n proposizioni atomiche, ci sono 2n possibilità di verità , e possiamo essere d’accordo con qualsiasi insieme di questi e in disaccordo con le restanti.

Ci saranno poi due casi estremi, quello in cui siamo d’accordo con tutte le possibilità, e in disaccordo con nessuno , l’altra in cui siamo d’accordo con nessuna e in disaccordo con tutte. La prima si chiama una tautologia, l’ultima una contraddizione.

La tautologia semplice è ‘ p o non p’: una tale affermazione non aggiunge nulla alla nostra conoscenza , e in realtà non asserisce affatto un fatto; ma è, per così dire , non una vera proposizione, ma un caso degenere . E si può trovare che tutte le proposizioni della logica sono in questo senso tautologie; e questa è la loro caratteristica distintiva. Tutte le proposizioni primitive nei Principia Mathematica sono tautologie, tranne l’Assioma di Riducibilità, e le regole di deduzione sono tali che da tautologie possono essere dedotte solo tautologie, in modo che se non fosse per quella magagna, l’intera struttura si comporrebbe di tautologie. Siamo dunque portati indietro alla vecchia difficoltà, ma è possibile sperare che anche questo può essere rimosso da alcune modifiche della Teoria dei Tipi che possono derivare dall’analisi di Wittgenstein.

Una teoria dei tipi ci deve consentire di evitare le contraddizioni; la teoria di Whitehead e Russell consisteva in due parti distinte, accomunate solo dal fatto di essere sia dedotte dal piuttosto vago ‘Principio del Circolo Vizioso’. La prima parte distingueva le funzioni proposizionali in base ai loro argomenti, cioè le classi in base ai loro membri; la seconda parte ha creato la necessità dell’Assioma di Riducibilità con il richiedere ulteriori distinzioni tra ordini di funzioni con lo stesso tipo di argomento.

Possiamo facilmente dividere le contraddizioni secondo quale parte della teoria è richiesta per la loro soluzione, e quando abbiamo fatto questo troviamo che questi due insiemi di contraddizioni si distinguono anche in un altro modo. Quelli risolte dalla prima parte della teoria sono tutte puramente logiche; quelle che non coinvolgono idee ma quelle di classe, relazione e numero, potrebbero essere poste secondo la logica simbolica, e si verificano nello sviluppo effettivo della matematica quando viene diretta nella giusta direzione.

Tali sono la contraddizione del più grande ordinale, e quello della classe di classi che non sono membri di se stessi .

Per quanto riguarda la soluzione di questi Russell sembra insostituibile.

D’altra parte, nessuna di quelle del secondo insieme di contraddizioni sono puramente logiche o matematiche, ma tutte coinvolgono qualche termine psicologico, come significare, definire, nominare o affermare. Essi non si verificano nella matematica, ma nel pensiero sulla matematica; così che è possibile che non derivano da un errore di logica o di matematica, ma dall’ambiguità nelle nozioni psicologiche o epistemologiche del significare e dell’asserire. Infatti, sembra che questo dovrebbe essere il caso, in quanto l’esame ci convince rapidamente che il termine psicologico è in ogni caso essenziale per la contraddizione, che non potrebbe essere costruita senza introdurre la relazione delle parole con il loro significato o qualche equivalente.

Se ora proviamo ad applicare al problema la teoria di generalità di Wittgenstein, possiamo, credo , abbastanza facilmente costruire una soluzione in tal senso. Spiegare questo adeguatamente richiederebbe un articolo a parte, ma può essere possibile darne un’idea in poche parole. Per la teoria di Wittgenstein una proposizione generale è equivalente ad una combinazione dei suoi casi, così che il tipo di fatto asserito da una proposizione generale non è sostanzialmente da quanto affermato da una combinazione di proposizioni atomiche. Ma il simbolo per una proposizione generale indica il suo significato in un modo diverso da quello in cui il simbolo di una proposizione elementare lo indica, perché quest’ultimo contiene i nomi di tutte le cose che lo riguardano, mentre il simbolo della proposizione generale contiene solo una variabile che sta per tutti i suoi valori ad un tempo. In modo che sebbene i due tipi di simbolo possano significare la stessa cosa, i sensi del significato in cui essi lo indicano devono essere diversi. Quindi gli ordini di proposizioni non saranno caratteristici di ciò che si intende, che è solo rilevante in matematica, ma dei simboli utilizzati per significarlo.

Le proposizioni del primo ordine saranno un po’ come le parole parlate; la stessa parola può essere scritta e parlata, e la stessa proposizione può teoricamente essere espressa in diversi ordini.

Applicando questo mutatis mutandis alle funzioni proposizionali, troviamo che le distinzioni tipiche tra funzioni con gli stessi argomenti non si applicano a ciò che significano, ma alla relazione di significato tra simbolo e oggetto significato. Di conseguenza, esse possono essere trascurate in matematica, e la soluzione delle contraddizioni può essere salvaguardata in una forma leggermente modificata, perché le contraddizioni pertinenti qui tutte hanno a che fare con la relazione di significato.

In questo modo penso che sia possibile sfuggire alla difficoltà dell’Assioma di Riducibilità, e rimuovere le varie altre obiezioni più filosofiche, che sono state fatte da Wittgenstein, riabilitando così il ragionamento generale dei Foundations of Mathematics date da Whitehead e Russell. Ma rimane comunque un punto importante in cui la teoria risultante deve essere considerata insoddisfacente, e che è in connessione con l’Assioma dell’Infinito .

Secondo gli autori dei Principia Mathematica non c’è modo di dimostrare che ci sono un numero infinito di oggetti in qualsiasi tipo logico; e se non c’è un numero infinito di qualsiasi tipo, l’intera teoria degli aggregati infiniti, serie, calcolo differenziale e analisi in generale cade.

Secondo la loro teoria di numero, se ci fossero solo dieci particolari, nel senso di numero appropriato a quei particolari tutti i numeri maggiori di dieci sarebbero identici alla classe nulla e così identici tra loro. Naturalmente ci sarebbero 210 classi di particolari, e quindi il successivo tipo di numero sarebbe certamente fino al 210, e così prendendo un tipo abbastanza elevato può essere raggiunto qualsiasi numero finito.

Ma sarà impossibile in questo modo raggiungere ℵ0.

Ci sono vari suggerimenti naturali per uscire da questa difficoltà, ma tutti questi sembrano portare a ricostituire la contraddizione del più grande ordinale.

Sembrerebbe quindi impossibile proporre l’analisi se non come conseguenza dell’Assioma dell’Infinito; né posso vedere che questo possa essere in generale discutibile, perché ci sarebbe poco senso dimostrare proposizioni su serie infinita a meno che questi oggetti esistessero. E d’altra parte la matematica di un mondo con un dato numero finito di membri è di scarso interesse teorico, in quanto tutti i suoi problemi possono essere risolti con un procedimento meccanico .

Ma una difficoltà mi sembra sorgere in relazione alle proposizioni elementari nella teoria dei numeri che possono essere dimostrati soltanto con metodi trascendentali, come la valutazione di Dirichlet della classe di numeri di forme quadratiche. Consideriamo un tale risultato della forma ‘ Ogni numero ha la proprietà p’ , dimostrata con metodi trascendentali solo per il caso di un mondo infinito; oltre a questo, se sapessimo che il mondo conteneva ad esempio, 1.000.000 di oggetti, potremmo dimostrarlo esaminando i numeri fino a 1.000.000. Ma supponiamo che il mondo è finito e ancora non conosciamo un qualsiasi limite superiore alla sua dimensione, allora siamo senza alcun metodo affatto di dimostrarlo.

Si potrebbe pensare che avremmo potuto sfuggire a questa conclusione dicendo che, sebbene non possa esistere nessun aggregato infinito, la nozione di un aggregato infinito non è auto- contraddittoria, e quindi ammissibile in matematica. Ma penso che questo suggerimento è inutile, per tre motivi: in primo luogo, appare come risultato di qualche piuttosto difficile, ma penso conclusivo, ragionamento di Wittgenstein che , se accettiamo la sua teoria delle proposizioni generali ed esistenziali (ed era solo il modo con cui potremmo sbarazzarci dell’Assioma di Riducibilità), ne consegue che, se non esistesse nessun insieme infinito il concetto di tale aggregato sarebbe auto-contraddittorio; in secondo luogo, tuttavia, potrebbe essere, è generalmente accettato che l’unico modo di dimostrare che certi postulati sono compatibili, che sia attraverso un teorema di esistenza che dimostra che in realtà esiste e non semplicemente che potrebbe esistere un sistema del genere postulato; in terzo luogo, anche se fosse scontato che l’idea di un aggregato infinito non sia auto-contraddittoria, dovremmo fare grandi modifiche nel nostro sistema di logica, al fine di convalidare le prove dipendenti dalle costruzioni in termini di oggetti che potrebbero esistere, ma non esistono. Il sistema dei Principia sarebbe del tutto inadeguato. Cosa allora si può fare ? Possiamo cercare di alterare le prove di tali proposizioni, e potrebbe quindi essere interessante cercare di sviluppare una nuova matematica senza l’ Assioma dell’Infinito; i metodi da adottare potrebbero assomigliare a quelli di Brouwer e Weyl. Tali autorità, tuttavia, mi sembrano essere scettiche circa le cose sbagliate nel respingere non l’Assioma dell’Infinito, ma la chiaramente tautologica Legge del Terzo Escluso. Ma non mi sento affatto sicuro che ogni cosa possa essere realizzata su queste linee di pensiero che sostituirebbero gli argomenti trascendentali attualmente impiegati.

Un’altra possibilità è che dovrebbe essere adottato il metodo generale di Hilbert, e che dovremmo usare la sua prova che nessuna contraddizione può essere dedotta dagli assiomi della matematica includendo un equivalente dell’Assioma dell’Infinito. Possiamo quindi argomentare così: se un dato numero ha o non ha la proprietà p può sempre essere trovato mediante il calcolo. Questo ci darà una prova formale del risultato per questo numero particolare, che non può contraddire il risultato generale dimostrato dall’Assioma dell’Infinito che deve quindi essere valido.

Ma questo argomento sarà ancora incompleto, perché si applicherà solo ai numeri che possono essere indicati con simboli nel nostro sistema.

E se stiamo negando l’ Assioma dell’Infinito, ci sarà un limite superiore al numero di segni che possono essere fatti sulla carta, dal momento che lo spazio e il tempo saranno finiti, sia in estensione sia in divisibilità, in modo che alcuni numeri saranno troppo grandi per essere scritti, e ad essi la prova non si applicherà. E questi numeri essendo finiti saranno esistenti in un tipo sufficientemente alto, e la teoria di Hilbert non ci aiuterà a dimostrare che essi hanno la proprietà p.

Un altra grave difficoltà circa l’ Assioma dell’Infinito è che, se è falso, è difficile vedere come l’analisi matematica possa essere utilizzata in fisica, che sembra richiedere alla sua matematica di essere vera e non solo di seguire da ipotesi potenzialmente false. Ma discutere questo in maniera adeguata ci porterebbe troppo lontano.

Su come portare avanti la questione ulteriormente, non ho alcun suggerimento da fare; tutto quello che spero è di aver messo in chiaro che l’argomento è molto difficile, e che le principali autorità sono molto scettiche sul fatto che la matematica pura come ordinariamente pensata possa essere logicamente giustificata, perché Brouwer e Weyl dicono che non può, e Hilbert propone soltanto di giustificarla come un gioco con segni senza senso sulla carta. D’altra parte, sebbene il mio tentativo di ricostruzione del punto di vista di Whitehead e Russell superi molte delle difficoltà, credo che sia impossibile considerarla del tutto soddisfacente.

Principia Mathematica cap. 5 – di The Foundation of Mathematics di Frank P. Ramsey

17 Mag

Frank_Plumpton_RamseyRiporto di seguito la mia traduzione del quinto capitolo della prima parte delle opere di F.P. Ramsey,  come pubblicate in The Foundation of Mathematics a cura di R.B. Braithwaite nella sezione I capitolo IV, con il titolo Gli Assiomi.

V. GLI ASSIOMI

Ho mostrato negli ultimi due capitoli come porre rimedio ai tre i principali difetti di Principia Mathematica come fondamento della matematica. Ora dobbiamo considerare due importanti problemi che rimangono che riguardano l’Assioma dell’Infinito e l’Assioma moltiplicativo. L’introduzione di questi due assiomi non è così grave come quello dell’Assioma di Riducibilità, perché non sono di per sé presupposti discutibili, e perché la matematica è in gran parte indipendente dall’Assioma moltiplicativo, e si può ragionevolmente supporre che possa richiedere un Assioma dell’Infinito. Tuttavia, dobbiamo cercare di determinare lo stato logico di tali assiomi – se sono tautologie o proposizioni empiriche o addirittura contraddizioni. In questa indagine comprenderò, per curiosità, l’Assioma di Riducibilità, anche se, dal momento che abbiamo rinunciato ad esso, in realtà non ci interessa più.

Cominciamo con l’Assioma di Riducibilità, che afferma che tutte le funzioni di particolari ottenute per generalizzazione di matrici sono equivalenti a funzioni elementari. Nel discuterlo si presentano molti casi, dei quali io considero solo il più interessante, quello cioè in cui il numero di particolari e di funzioni atomiche di particolari sono entrambi infiniti. In questo caso l’assioma è una proposizione empirica, vale a dire, né una tautologia né una contraddizione, e quindi non può essere né affermata né negata dalla logica o matematica. Questo è mostrato come segue: –

( a) L’assioma non è una contraddizione, ma può essere vero.

Perché è chiaramente possibile che ci potrebbe essere una funzione atomica che definisce ogni classe di particolari. In tal caso ogni funzione sarebbe equivalente non solo a una funzione elementare ma a una funzione atomica.

( b) L’assioma non è una tautologia, ma può essere falso.

Perché è chiaramente possibile che vi sia una infinità di funzioni atomiche, e un particolare a tale che qualsiasi funzione atomica prendiamo c’è un altro particolare che si accorda con a in relazione a tutte le altre funzioni, ma non per quanto riguarda la funzione di assunta.  Allora (φ) . φ ! x ≣φ ! a non potrebbe essere equivalente a qualsiasi funzione elementare di x.

Avendo così dimostrato che l’Assioma di Riducibilità non è né una tautologia né una contraddizione, cerchiamo di procedere con l’Assioma moltiplicativo. Questo afferma che, data una qualsiasi classe K esistente delle classi esistenti, c’è una classe che ha esattamente un elemento in comune con ogni membro di K. Se per ‘classe’ intendiamo, come faccio io , qualsiasi insieme di oggetti omogenei nel tipo non necessariamente definibile con una funzione che non sia una pura funzione in estensione, l’Assioma moltiplicativo mi sembra la più evidente tautologia. Non vedo come questo possa essere oggetto di ragionevole dubbio, e penso che non sarebbe mai stato messo in dubbio se non fosse stato male interpretato. Perché il significato che ha in Principia, dove la classe la cui esistenza esso asserisce deve essere una classe definibile con una funzione proposizionale del genere che si verifica in Principia, diventa veramente dubbio e, come l’Assioma di Riducibilità, né una tautologia né una contraddizione. Dimostriamo questo mostrando

( a) Non è una contraddizione.

Perché è chiaramente possibile che ogni classe (nel mio senso ) dovrebbe essere definita da una funzione atomica, in modo che, dal momento che è inevitabile che ci sia una classe nel mio senso avente un membro in comune con ciascun membro di K, questa sarebbe anche una classe nel senso dei Principia.

( b) Non è una tautologia.

Per dimostrare questo abbiamo bisogno di prendere non l’Assioma moltiplicativo in sé, ma il teorema equivalente che due classi qualsiasi sono commensurabili.

Si consideri poi il seguente caso: non ci siano funzioni atomiche di due o più variabili, e solo le seguenti funzioni atomiche di una variabile: –

Associato a ciascun particolare a ad una funzione atomica φSchermata 2013-08-22 alle 18.42.59 tale che

φa x. ≣x . x = a

Un’altra funzione atomica fSchermata 2013-08-22 alle 18.42.59 tale che Schermata 2013-08-22 alle 18.42.59 ( fx ) , Schermata 2013-08-22 alle 18.42.59 ( ~ fx) sono entrambe classi infinite.

Allora non c’è una relazione biunivoca, nel senso dei Principia, aventi una Schermata 2013-08-22 alle 18.42.59 ( fx ) o Schermata 2013-08-22 alle 18.42.59 ( ~ fx ) per dominio, e quindi queste due classi sono incommensurabili. Da qui l’Assioma moltiplicativo, interpretato come è nei Principia, non è una tautologia, ma è dubbio dal punto di vista della logica. Ma, come l’ho interpretato, è una tautologia evidente, e questo può essere affermato come un ulteriore vantaggio nella mia teoria. Si potrebbe obiettare che, se si tratta di una tautologia, dovrebbe essere in grado di essere provato, cioè dedotto da più semplici proposizioni primitive che sono sufficienti per la deduzione del resto della matematica. Ma non mi sembra affatto improbabile che potrebbe esistere una tautologia, che potrebbe essere posta in termini finiti, la cui dimostrazione sarebbe, tuttavia, infinitamente complicata e quindi impossibile per noi. Inoltre, non possiamo aspettarci di dimostrare l’Assioma moltiplicativo nel mio sistema, perché il mio sistema è formalmente la stesso di quello dei Principia , e l’Assioma moltiplicativo ovviamente non può essere dimostrato nel sistema dei Principia, in cui non è una tautologia.

Veniamo ora all’Assioma dell’Infinito, di cui ancora una volta il mio sistema e quello dei Principia danno diverse interpretazioni. Nei Principia, a causa della definizione dell’identità ivi utilizzato, l’assioma significa che esistono un’infinità di particolari distinguibili, che è una proposizione empirica; dal momento che, anche supponendo che ci sia un’infinità di particolari, la logica non può determinare se esistendo una infinità di questi non ci siano due di questi che abbiano le loro proprietà in comune; ma nel mio sistema, che ammette funzioni di estensione, l’Assioma dell’Infinito afferma semplicemente che ci sono un numero infinito di particolari. Questo sembra ugualmente essere una mera questione di fatto; ma la profonda analisi di Wittgenstein ha dimostrato che questa è un’illusione, e che, se questo significa qualcosa, deve essere o una tautologia o una contraddizione. Questo sarà molto più facile da spiegare se cominciamo non con l’infinito, ma con un numero un po’ più piccolo.

Cominciamo con ‘ Esiste un particolare ‘ , o scrivendo nel modo più semplice possibile, in notazione logica,

‘ ( ∃ x ) . x = x ‘

Ora che cosa è questa proposizione? E ‘ la somma logica delle tautologie x = x per tutti i valori di x , ed è quindi una tautologia. Ma supponiamo che non ci siano particolari, e quindi nessun valore di x, allora la formula di cui sopra è una assoluto nonsenso. Quindi, se questo significa qualcosa, deve essere una tautologia.

Inoltre prendiamo ‘ Ci sono almeno due individui ‘ o

‘ ( ∃ x , y ) . x ≠ y ‘ .

Questa è la somma logica delle proposizioni x ≠ y , che sono tautologie se x e y hanno valori diversi, contraddizioni se hanno lo stesso valore. Perciò, è la somma logica di un insieme di tautologie e contraddizioni; e quindi una tautologia se uno qualsiasi degli insiemi è una tautologia, ma altrimenti una contraddizione. Cioè, è una tautologia se x e y possono assumere valori diversi (ad esempio se ci sono due particolari), ma altrimenti una contraddizione.

Una piccola riflessione renderà chiaro che questo non riguarda il caso solo di 2, ma di qualsiasi altro numero, finito o infinito. Cioè, ‘ Ci sono almeno n particolari’ è sempre o una tautologia o una contraddizione, mai una vera e propria proposizione. Non possiamo, dunque, dire nulla circa il numero di particolari, dal momento che, quando tentiamo di farlo, non riusciremmo mai a costruire una vera proposizione, ma soltanto una formula che è o tautologica o auto – contraddittoria. Il numero di particolari può, nella frase di Wittgenstein, essere solo indicato, e sarà dimostrato dal fatto che le formule di cui sopra sono tautologiche o contraddittorie.

La sequenza ‘ Esiste un particolare ‘,

‘ Esistono almeno 2 particolari ‘,

‘ Esistono almeno n particolari ‘,

‘ Esistono almeno ℵ0 particolari ‘,

‘ Esistono almeno ℵ1 particolari ‘,

comincia con l’essere tautologica; ma da qualche parte comincia con l’essere contraddittoria, e la posizione dell’ultimo termine tautologico mostra il numero di particolari.

Ci si potrebbe chiedere come, se non si può dire nulla su questo, siamo in grado di immaginare come distinte possibilità che il numero di particolari nel mondo sia così e così. Facciamo questo solo quando assumiamo non un limitato universo in esame, a cui saremmo confinati, così che con ‘tutto’ intendiamo tutto nell’universo in esame; e allora questo universo così e così che contiene tali e tali particolari è una possibilità effettiva, e può essere asserito in una genuina proposizione. E’ questo solo quando assumiamo, non un limitato universo in esame, ma l’intero mondo, di cui nulla può essere detto sul numero di particolari  in esso contenuti.

Possiamo fare logica , non solo per il mondo nel suo insieme, ma anche per un determinato universo limitato nella trattazione; se ne assumiamo uno contenente n individui,

Nc’Schermata 2013-08-22 alle 18.42.59 ( x = x ) ≥ n sarà una tautologia,

Nc’Schermata 2013-08-22 alle 18.42.59 ( x = x ) ≥ n + 1 una contraddizione ,

Quindi Nc’Schermata 2013-08-22 alle 18.42.59 ( x = x ) ≥ n + 1 non può essere dedotta dalle proposizioni primitive comuni a tutti gli universi, e quindi per un universo che contiene n + 1 individui deve essere presa come una proposizione primitiva.

Analogamente, l’Assioma dell’Infinito nella logica del mondo nel suo insieme, se si tratta di una tautologia, non può essere provato, ma deve essere preso come una proposizione primitiva . E questa è la direzione che dobbiamo adottare, a meno che preferiamo il punto di vista che tutta l’analisi è auto – contraddittoria e priva di significato . Non dobbiamo supporre che un particolare insieme di oggetti, ad esempio, gli atomi, sia infinito, ma semplicemente che c’è un certo tipo di infinito che possiamo assumere essere il tipo dei particolari.

NdT: quest’ultima proposizione chiude il discorso sull’esistenza o non esistenza dell’infinito (matematico o fisico). Infatti si può chiaramente osservare che l’applicazione di un tipo particolare di infinito nasce dall’impossibilità di determinare se un infinito esista anche se non conduce a contraddizioni logiche. Infatti è evidente che esistono dei procedimenti che non possono essere conclusi neppure se tutta l’umanità fino alla sua estinzione cercasse di portarli a compimento. In questi casi è indifferente sapere se il procedimento è finito o infinito in quanto non ci sarebbe nessuno in grado di trovare il risultato e di riprodurlo nel proprio sistema secondario. Mentre nel sistema primario potrebbe esistere, ma sarebbe un nonsenso per mancanza di chi è in grado di valutarlo.

Principia Mathematica cap. 4 – di The Foundation of Mathematics di Frank P. Ramsey

16 Mag

NPG x31078; Richard Bevan Braithwaite by Ramsey & MusprattRiporto di seguito la mia traduzione del quarto capitolo della prima parte delle opere di F.P. Ramsey,  come pubblicate in The Foundation of Mathematics a cura di R.B. Braithwaite nella sezione I capitolo IV, con il titolo Funzioni proposizionali in estensione.

IV . Funzioni proposizionali in estensione

Prima di andare avanti, guardiamoci attorno e vediamo dove siamo arrivati. Abbiamo visto che l’introduzione della nozione di funzione predicativa ci ha dato un insieme per φ che ci permette di fare a meno dell’Assioma di Riducibilità. Quindi rimuove il secondo e più importante difetto nella teoria dei Principia Mathematica; ma in quale rapporto stiamo per quanto riguarda le altre difficoltà, la difficoltà di includere tutte le classi e le relazioni in estensione, e non solo quelle definibili, e le difficoltà connesse con l’identità?

Possiamo sbarazzarci della difficoltà sull’identità, a costo di notevoli complicazioni, adottando la  convenzione di Wittgenstein, che ci permette di eliminare ‘=’ da ogni proposizione in cui si verifica. Ma questo ci mette in una posizione disperata per quanto riguarda le classi, perché , avendo eliminato del tutto l’ ‘=’, non possiamo più usare x = y come funzione proposizionale nel definire delle classi finite. Così che le sole classi con cui siamo ora in grado di operare sono quelle definite dalle funzioni predicative.

Può essere utile qui ripetere la definizione di una funzione predicativa di particolari; è qualsiasi funzione verità di funzioni atomiche e di proposizioni atomiche. Chiamiamo tali funzioni ‘ predicative ‘ perché corrispondono, come quasi una nozione precisa possa esserlo di una vaga, all’idea che φa è predicato della stessa cosa di a come φb lo è di b . Essa comprende tutte le funzioni proposizionali che si verificano in Principia Mathematica, tra cui l’identità come ivi definita. E’ ovvio, comunque, che noi non dovremmo definire l’identità in questo modo, come accordo nei confronti di tutte le funzioni predicative, perché due cose possono chiaramente essere in accordo per quanto riguarda tutte le funzioni atomiche e quindi per quanto riguarda tutte le funzioni predicative, eppure si tratta di due cose e non, come la definizione proposta dell’identità comporterebbe, un solo oggetto.

Quindi la nostra teoria è altrettanto inadeguata dei Principia Mathematica a fornire una logica estensionale; infatti, se rifiutiamo questa falsa definizione dell’identità, non siamo in grado di includere tra le classi che che ne hanno a che fare anche con tutte le classi finite enumerate. La matematica diventa allora senza speranza perché non possiamo essere sicuri che ci sia una classe definita da una funzione predicativa il cui numero è due; perché gli oggetti possono tutti rientrare in triadi che si accordano in ogni aspetto, nel qual caso non ci sarebbero nel nostro sistema di classi di un membro né classi a due membri.

Se vogliamo preservare del tutto la forma ordinaria della matematica, sembra che qualche estensione deve essere fornita per la nozione di funzione proposizionale, in modo da comprendere pure altre classi. Una tale estensione è auspicabile per altri motivi, perché molti oggetti che sarebbe naturalmente essere considerati come funzioni proposizionali possono essere visti non essere funzioni predicative.

Per esempio

F ( x , y ) = Qualcosa di diverso da  x e y che soddisfa φz circonflesso

(Qui, naturalmente , ‘ diverso ‘ deve essere assunto in senso stretto, e non nel senso dei Principia Mathematica come ‘ distinguibile da ‘.)

 Questa non è una funzione predicativa, ma è costituita dalle parti di due funzioni predicative :

( 1 ) Per ( x ≠ y )

F ( x , y) è φx . φy : ⊃. Nc’z circonflesso ( φz ) ≥ 3 : . φx . ~ φy . v φy . ~ φx : ⊃ : Nc’z circonflesso ( φ z) ≥ 2 : . ~ φx . ~ φy : ⊃ : Nc’z circonflesso ( φz ) ≥ 1 .

 Questa è una funzione predicativa perché è una funzione verità di φx , φy e la proposizione costante Nc’z circonflesso ( φz ) > 1 , 2 , 3 , che non coinvolge x , y .

( 2) Per x = y

F ( x , x ) è φ ( x ) . ⊃. Nc’z circonflesso ( φz ) ≥ 2 : ~ φx . ⊃. Nc’z circonflesso ( φz ) ≥ 1 ,

che è una funzione predicativa .

Ma F ( x , y ) non è essa stessa una funzione predicativa; questo forse è più difficile da vedere. Ma è facile vedere che tutte le funzioni di questo tipo non possono essere predicative, perché se lo fossero saremmo riusciti a trovare una funzione predicativa soddisfatta solamente da ogni particolare a, che chiaramente in generale non può essere.

Perché supponiamo fa (se no, prendiamo ~ fSchermata 2013-08-22 alle 18.42.59 ) .

Sia       α = Schermata 2013-08-22 alle 18.42.59 ( fx ) ,

Β = α – ( a) .

Allora φx = ‘Non c’è niente che la soddisfa fx tranne x, e i membri di β ‘ si applicano ad a e solamente ad a. Quindi queste funzioni non possono essere mai predicative.

Proprio come F ( x , y ) di cui sopra, così anche ‘ x = y ‘ è costituita da due funzioni predicative :

( 1) Per x ≠ y

‘ x = y ‘ può essere assunto ad essere ( ∃φ ) . φx . ~ φx : ( ∃φ ) . φy . ~ φy , cioè una contraddizione.

( 2) Per x = y

‘ x = y ‘ può essere assunto essere ( φ ) : . φx . v . ~ φx : φy . v . ~ φy , cioè una tautologia.

Ma ‘ x = y ‘ non è di per sé predicativa .

Sembra, quindi , che dobbiamo introdurre funzioni propositive non-predicative. Come si deve fare? L’ unica via praticabile è quello di farlo nel modo più radicale e drastico possibile; far cadere del tutto la nozione che φa riguardi a quello che φb riguarda b; il trattare le funzioni propositive come funzioni matematiche, cioè, rendendole completamente estensionali. Infatti è chiaro che, essendo funzioni matematiche derivate da funzioni proposizionali, si deve avere un valore adeguatamente estensionale delle prime solo adottando un punto di vista completamente estensionale di queste ultime.

Quindi oltre al concetto precedentemente definito di una funzione predicativa, di cui avremo ancora bisogno per determinati scopi, definiamo, o meglio spieghiamo, nel nostro sistema che deve essere preso come indefinibile il nuovo concetto di una funzione proposizionale in estensione. Tale funzione di un particolare risulta da qualsiasi relazione uno-molti in estensione tra proposizioni e particolari; vale a dire, una correlazione, praticabile o impraticabile, che per ogni particolare associa una unica proposizione, essendo il particolare l’ argomento della funzione, la proposizione suo valore.

Così φ (Socrates) può essere che la regina Anne è morta ,

φ ( Platone ) potrebbe essere che   Einstein è un grand’uomo ;

φSchermata 2013-08-22 alle 18.42.59 essendo semplicemente una associazione arbitraria di proposizioni φx con particolari x .

Una funzione in estensione sarà caratterizzata da un suffisso e quindi φeSchermata 2013-08-22 alle 18.42.59.

 Quindi possiamo parlare della totalità di tali funzioni come la gamma di valori di una variabile  apparente φe.

Consideriamo ora ( φe ) . φex≣φey.

Questo afferma che in una tale correlazione la proposizione correlata con x è equivalente a quella correlata con y.

Se x = y è una tautologia (è il prodotto logico dei valori di p≣p ) .

Ma se x ≠ y è una contraddizione . Perché in una delle correlazioni alcuni p saranno associati ad x , e ~ p con y.

Allora perché questa correlazione feSchermata 2013-08-22 alle 18.42.59 , fex è p, fey è ~ p, così che fex ≣ fey è autoontraddittoria e ( φe) . φex ≣ φey è auto- contraddittoria .

Quindi ( φe ) . φe x ≣ φe y è una tautologia se x = y , una contraddizione se x ≠y.1

Quindi questa si può adeguatamente prendere come la definizione di x = y. x = y è una funzione in estensione di due variabili. Il suo valore è una tautologia , quando x e y hanno lo stesso valore , la contraddizione quando x , y hanno valori differenti.

Ora dobbiamo difendere questo insieme consigliato di funzioni per una variabile φe contro le accuse che è illegittimo e porta a contraddizioni. È legittimo perché è una notazione comprensibile, che fornisce un significato definito ai simboli in cui è utilizzata. Né può portare a contraddizioni perché sfugge alle contraddizioni che vengono in mente come fanno l’insieme delle funzioni predicative. Qualsiasi simbolo contenente la variabile φe significa in modo diverso da un simbolo che non la contiene, e avremo lo stesso tipo di ambiguità di ‘ significato ‘, come nel capitolo III, che rimuoverà le contraddizioni. Né può qualsiasi contraddizione del primo gruppo di contraddizioni essere ripristinata dalla nostra nuova notazione, perché sarà ancora impossibile per una classe di essere un membro di se stessa, come le nostre funzioni in estensione si limitano a tipi definiti di argomenti per definizione .

1 D’altra parte ( φ ) . φx≣ φy ( φ predicativo ) è una tautologia se x = y , ma non una contraddizione se x ≠ y.

Dobbiamo ora assumere le due nozioni che abbiamo definito, funzioni predicative e funzioni in estensione, e considerare quando avremo bisogno di usare l’una e quando l’altra.1 Prima prendiamo il caso in cui gli argomenti sono particolari: allora c’è ogni vantaggio nell’assumere che l’insieme di funzioni che usiamo in matematica sia quello di funzioni in estensione. Abbiamo visto come questo ci permette di definire l’identità in modo soddisfacente, ed è ovvio che non avremo bisogno di nessun Assioma di Riducibilità, perché qualsiasi funzione proposizionale ottenuta per generalizzazione, o in un qualsiasi modo, è una funzione in estensione. Inoltre ci darà una soddisfacente teoria delle classi, perché ogni classe sarà definita da una funzione in estensione, ad esempio dalla funzione che è tautologia per ogni membro della classe come argomento, ma contraddizione per qualsiasi altro argomento, e la classe nulla sarà definita dalla funzione di auto-contraddizione. Così la totalità delle classi può essere ridotta a quella di funzioni in estensione, e quindi sarà questa totalità che noi richiederemo in matematica, non la totalità delle funzioni predicative, che corrisponde non a ‘tutte le classi ‘, ma a ‘ tutti i predicati ‘ o ‘ tutte le proprietà’.

D’altra parte, quando si arriva a funzioni di funzioni la situazione è piuttosto diversa. Non sembra esserci nessuno scopo nel considerarne qualcuna tranne funzioni predicative di funzioni; le ragioni per l’introduzione di funzioni di estensione non sono più applicabili. Perché non abbiamo bisogno di definire l’identità tra funzioni, ma solo l’identità tra classi che si riduce ad equivalenza tra funzioni, che è facilmente definita. Né vogliamo considerare classi di funzioni, ma classi di classi, di cui è anche possibile un trattamento più semplice. Quindi, nel caso di funzioni di funzioni ci limitiamo a quelle che sono predicative.

1 Naturalmente funzioni predicative sono anche funzioni in estensione; la domanda è: che insieme vogliamo per la nostra funzione variabile.

Ricordiamo la definizione di una funzione predicativa di funzioni; è una funzione verità dei loro valori e proposizioni costanti.1 Tutte le funzioni di funzioni che compaiono in Principia sono di questo tipo , ma ‘ credo ( x ) . φx ‘ come una funzione φSchermata 2013-08-22 alle 18.42.59 non è. Le funzioni predicative di funzioni sono estensionali nel senso dei Principia , che se l’insieme di f ( fi circonflessoSchermata 2013-08-22 alle 18.42.59) è quello delle funzioni predicativi di funzioni .

φex ≣ x ψe x : ⊃: f ( φeSchermata 2013-08-22 alle 18.42.59 ) ≣ f ( ψe Schermata 2013-08-22 alle 18.42.59 )

Questo perché f ( φeSchermata 2013-08-22 alle 18.42.59 ) è una funzione verità dei valori di φex che sono equivalenti ai corrispondenti valori di ψe x , così che f ( φeSchermata 2013-08-22 alle 18.42.59 ) è equivalente a f ( ψe Schermata 2013-08-22 alle 18.42.59 ) .

Se abbiamo assunto questo dovremmo avere una semplice teoria delle classi, dal momento che non vi sarebbe alcun bisogno di distinguereSchermata 2013-08-22 alle 18.42.59 ( φex ) da  φeSchermata 2013-08-22 alle 18.42.59 . Ma sebbene sia una tautologia chiaramente non c’è modo di dimostrarlo, in modo che dovremmo assumerla come una proposizione primitiva. Se vogliamo evitarlo dobbiamo solo mantenere la teoria delle classi riportate nel Principia in base alla ” funzione estensionale derivata “. L’insieme di funzioni predicative di funzioni è adeguata ad affrontare le classi di classi, perché , sebbene , come abbiamo visto, ci possono essere classi di particolari che possono essere definite solo con funzioni di estensione, pure qualsiasi classe di classi può essere definita da una funzione predicativa , cioè da f ( α) dove

f ( φeSchermata 2013-08-22 alle 18.42.59 ) = Σψ ( φex º x ψex )

cioè la somma logica di ( φex≣ x ψex ) per tutte le funzioni ψex ^ che definiscono i membri della classe di classi.

1 Sono, credo, funzioni predicative di funzioni che Russell nell’Introduzione alla seconda edizione dei Principia cerca di descrivere come funzioni in cui le funzioni entrano solo attraverso i loro valori. Ma questa è chiaramente una descrizione insufficiente, perché φSchermata 2013-08-22 alle 18.42.59 entra solo in F(φSchermata 2013-08-22 alle 18.42.59) = ‘ io credo φa’ attraverso i suoi valori φa, ma questo non è certamente una funzione del tipo indicato, perché non è estensionale . Penso che il punto può essere spiegato, come ho fatto, solo con l’introduzione della nozione di funzione verità. Il sostenere, come fa Russell, che tutte le funzioni di funzioni sono predicative è intraprendere una disputa verbale inutile, a causa dell’ambiguità del vago termine funzioni di funzioni, che possono essere utilizzate per significare per esempio di essere predicative o di comprendere per esempio anche F ( φSchermata 2013-08-22 alle 18.42.59 ) come sopra.

Naturalmente , se la classe di classi è infinita, questa espressione non può essere scritta. Ma, tuttavia, esisterà la somma logica di queste funzioni, anche se non possiamo esprimerla.1

Quindi, per ottenere una teoria completa delle classi dobbiamo assumere che l’insieme di funzioni di particolari sia quello delle funzioni in estensione; ma che l’insieme delle funzioni di funzioni particolari sia quello delle funzioni predicative. Utilizzando queste variabili otteniamo il sistema dei Principia Mathematica, semplificato per l’omissione dell’Assioma di Riducibilità, e alcune modifiche corrispondenti. Formalmente è quasi inalterato, ma il suo significato è stato notevolmente cambiato. E nel preservare così la forma mentre si modifica l’interpretazione, sto seguendo la grande scuola dei logici matematici che, in virtù di una serie di definizioni sorprendenti, hanno salvato la matematica dagli scettici, e ha fornito una dimostrazione rigorosa delle sue proposizioni. Solo così possiamo preservarla dalla minaccia bolscevica di Brouwer e Weyl .

1 Una somma logica non è come una somma algebrica; solo un numero finito di termini può avere una somma algebrica, perché una ‘ somma infinita ‘ è in effetti un limite. Ma la somma logica di un insieme di proposizioni è la proposizione che queste non sono tutte false, ed esiste sia che l’insieme sia finito o che sia infinito.

Principia Mathematica – Cap. 3 di The Foundation of Mathematics di Frank P. Ramsey

16 Mag

Honourable_Bertrand_RussellRiporto di seguito la traduzione del terzo capitolo della prima parte delle opere di F.P. Ramsey,  come pubblicate in The Foundation of Mathematics a cura di R.B. Braithwaite nella sezione I capitolo III, con il titolo Funzioni Predicative.

III FUNZIONI PREDICATIVE

In questo capitolo prenderemo in considerazione la seconda delle tre obiezioni che abbiamo fatto nell’ultimo capitolo alla teoria dei fondamenti della matematica fornita nei Principia Mathematica. Questa obiezione, che è forse la più grave delle tre, era diretta contro la Teoria dei Tipi, che sembrava comportare l’ accettazione dell’illegittimo Assioma di Riducibilità o il rifiuto di un tipo fondamentale di ragionamento matematico come la sezione Dedekind. Abbiamo visto che questa difficoltà deriva dalla seconda delle due parti in cui la teoria è stata divisa, cioè quella parte che riguarda i diversi insiemi di funzioni di determinati argomenti, ad esempio i particolari; e dobbiamo considerare se questa parte della Teoria dei Tipi non può essere modificata in modo da uscire dalla difficoltà. Vedremo che questo può essere fatto in modo semplice e diretto, che è una naturale conseguenza delle teorie logiche di Wittgenstein.

Dovremo ripartire da capo dalla sua teoria delle proposizioni, di cui qualcosa è stato detto nel primo capitolo. Abbiamo visto lì che spiega le proposizioni in generale, con riferimento alle proposizioni atomiche, ogni proposizione che esprime accordo e disaccordo con la possibilità di verità delle proposizioni atomiche. Abbiamo anche visto che potremmo costruire molti simboli diversi, tutti esprimenti accordo e disaccordo con lo stesso insieme di possibilità. Per esempio ,

‘ p ⊃ q ‘ ‘ ~ p . v . q ‘ , ‘ ~ : p . ~ q ‘ . . ‘ ~ q.⊃. ~ p ‘

sono un tale insieme, tutti in accordo con le tre possibilità

‘ p.q , ‘ ‘ ~ p.q , ‘ ‘ ~ p . ~ q

ma in disaccordo con la ‘p . ~ q ‘ . Due simboli di questo tipo, che esprimono accordo e disaccordo con gli stessi insiemi di possibilità, si dicono essere casi della stessa proposizione. Sono casi di essa così come tutti il ‘ gli ” in una pagina sono casi della parola ‘ gli ‘. Ma mentre i ‘ gli ” sono casi della stessa parola con riferimento alla loro somiglianza fisica, simboli diversi sono casi della stessa proposizione perché hanno lo stesso significato, cioè, esprimono accordo con gli stessi insiemi di possibilità. Quando parliamo di proposizioni intenderemo i tipi di cui i singoli simboli sono degli esempi, ed includeremo tipi di cui non sono esempi. Questo è inevitabile, in quanto non può essere un nostro interesse di queste se qualcuno ha effettivamente affermato o messo in simboli una proposizione, e dobbiamo considerare tutte le proposizioni nel senso di tutte le possibili asserzioni sia che siano state o meno asserite.

Ogni proposizione esprime accordo e disaccordo con gli insiemi complementari di possibilità di verità di proposizioni atomiche; per converso, dato un qualunque insieme di queste possibilità di verità, sarebbe logicamente possibile affermare accordo con alcune e di disaccordo con tutti le altre, e l’insieme delle possibilità di verità definisce quindi una proposizione. Questa proposizione può in pratica essere estremamente difficile da esprimere attraverso la povertà della nostra lingua, perché ci difettano sia i nomi per molti oggetti sia i metodi di fare affermazioni che coinvolgono un numero infinito di proposizioni atomiche, salvo casi relativamente semplici, come ad esempio ‘ ( x ) . φx ‘ , che implica (probabilmente) l’insieme infinito di (in alcuni casi) proposizioni atomiche, ‘ φa ‘ , ‘ φb , ‘ ecc. Tuttavia , dobbiamo prendere in considerazione proposizioni che il nostro linguaggio è inadeguato a esprimere. In ‘ ( x ) . Φx ‘ affermiamo la verità di tutte le possibili proposizioni che siano della forma ‘ φx ‘ anche se non abbiamo nomi per tutti i valori di x. Le proposizioni generali devono, ovviamente, essere intese come applicabili a tutto, non solo a tutto ciò per cui abbiamo un nome.

Veniamo ora ad un punto più importante in relazione con la Teoria dei Tipi. Abbiamo spiegato nel precedente capitolo cosa si intendesse per una proposizione elementare, vale a dire, una proposizione costruita esplicitamente come una funzione verità di proposizioni atomiche. Dobbiamo ora vedere che, secondo la teoria di Wittgenstein, elementare non è affatto un aggettivo del tipo proposizionale, ma solo dei suoi casi. Per un simbolo proposizionale elementare e non elementare potrebbero esistere casi della stessa proposizione. Così supponiamo che un elenco sia stato fatto di tutti i particolari come ‘a’ , ‘ b ‘ , …. , ‘z’ . Allora, se φSchermata 2013-08-22 alle 18.42.59 fosse una funzione elementare , ‘ φa . φb … φz ‘ sarebbe una proposizione elementare; ma ‘ ( x ) . φx ‘ non – elementare; ma questi esprimerebbero accordo e disaccordo con le stesse possibilità e quindi sarebbero la stessa proposizione. Oppure, per fare un esempio che potrebbe effettivamente verificarsi, ‘ φa ‘ e ‘ φa : ( ∃ x ). φx ‘ . , Che sono la stessa proposizione , in quanto ( ∃ x ) φx non aggiunge nulla a φa . Ma la prima è elementare, la seconda non elementare.

Quindi alcuni casi di una proposizione possono essere elementari, e altri non elementari; cosicché l’essere elementare non è veramente una caratteristica della proposizione, ma del suo modo di esprimerla. ‘ Proposizione elementare ‘ è come ‘ parola parlata’; proprio come la stessa parola può essere scritta e parlata, così la stessa proposizione può essere espressa sia elementarmente sia non elementarmente.

Dopo queste spiegazioni preliminari andiamo alla teoria delle funzioni proposizionali. Per una funzione proposizionale di particolari intendiamo un simbolo nella forma ‘ f (Schermata 2013-08-22 alle 18.42.59 , y circonflesso, z circonflesso … ) ‘,che è tale che , essendo in questa i nomi di tutti i particolari sostituiti con ‘ Schermata 2013-08-22 alle 18.42.59 ‘ , ‘y circonflesso ‘ , ‘ z circonflesso ‘ …… in essa , il risultato sarebbe sempre una proposizione. Questa definizione deve essere completata dalla spiegazione che due di tali simboli sono considerati la stessa funzione quando la sostituzione dello stesso insieme di nomi nell’uno e nell’altro dà sempre la stessa proposizione. Così se ‘ f (a , b , c ) ‘ , ‘ g (a, b , c ) ‘ sono la stessa proposizione per ogni insieme di a, b , c , ‘ f ( Schermata 2013-08-22 alle 18.42.59 , y circonflesso , z circonflesso ) ‘ e ‘ g ( Schermata 2013-08-22 alle 18.42.59 ,y circonflesso , z circonflesso) ‘ sono la stessa funzione , anche se sono molto differenti nel modo di presentarsi.

Una funzione 1 φx ^ ‘ ci fornisce per ogni particolare una proposizione nel significato di una proposizione-tipo (che non può avere nessun caso, perché noi non possiamo aver dato un nome ad un particolare). Quindi la funzione raggruppa un insieme di proposizioni, la cui somma e prodotto logico affermiamo scrivendo rispettivamente ‘ (∃ x ) . φx ‘ , ‘ ( x ) . φx ‘ . Questa procedura può essere estesa al caso di più variabili .

1 Per ‘funzione’ in futuro intenderemo sempre funzione proposizionale salvo venga indicato altrimenti.

Consideriamo ‘ φ ( Schermata 2013-08-22 alle 18.42.59 , y circonflesso )’; diamo a y un qualsiasi valore costante η , e φ ( Schermata 2013-08-22 alle 18.42.59 , η ) ‘ dà una proposizione quando un nome particolare viene sostituito a Schermata 2013-08-22 alle 18.42.59 , ed è quindi una funzione di una variabile, da cui possiamo formare le proposizioni

‘ ( ∃ x ) . φ ( x , η ) ‘ , ‘ ( x ) . φ ( x , η ) ‘ .

Consideriamo poi ‘ ( ∃ x ) φ ( x , y circonflesso) ” , questo , come abbiamo visto , dà una proposizione quando qualsiasi nome ( ad esempio ‘ η ‘) viene sostituito ad ‘ y’ , ed è quindi una funzione di una variabile da cui possiamo formare le proposizioni

( ∃ y ) : (∃ x ) . φ ( x , y ) e ( y ) : ( ∃ x ) . φ ( x , y) .

Per quanto finora non vi sia stata alcuna difficoltà, cercheremo di trattare le funzioni di funzioni esattamente nello stesso modo in cui abbiamo trattato le funzioni di particolari. Prendiamo , per semplicità, una funzione di una variabile che è funzione di particolari.

Questa avrebbe una simbologia della forma ‘ f ( fi circonflesso Schermata 2013-08-22 alle 18.42.59 ) ‘, che diventa una proposizione con la sostituzione di ‘ fi circonflesso Schermata 2013-08-22 alle 18.42.59 ‘ con una qualsiasi funzione di un particolare. ‘ f ( φSchermata 2013-08-22 alle 18.42.59) ‘ allora raccoglie insieme un insieme di proposizioni, una per ogni funzione di un particolare, di cui affermiamo la somma logica e il prodotto scrivendo rispettivamente ‘ (∃ φ ) . f ( φSchermata 2013-08-22 alle 18.42.59 ) ‘ , ‘ ( φ ) . f ( φSchermata 2013-08-22 alle 18.42.59 ) ‘ .

Ma questo ragionamento soffre di una sfortunata vaghezza quanto all’intervallo di funzioni φSchermata 2013-08-22 alle 18.42.59 che danno i valori di f ( φSchermata 2013-08-22 alle 18.42.59 ) di cui asseriamo la somma logica o il prodotto logico. A questo proposito c’è una differenza importante tra le funzioni di funzioni e funzioni di particolari che vale la pena di esaminare attentamente. Appare chiaramente nel fatto che l’espressione ‘ funzione di funzioni ‘ e ‘ funzione di particolari ‘ non sono esattamente analoghe; perché, mentre le funzioni sono simboli, i particolari sono oggetti, così che per ottenere un’espressione analoga a ‘ funzione di funzioni ‘ dovremmo dire ‘ funzione di nomi di particolari ‘. D’altra parte, non appare alcun modo semplice di modificare ‘ funzione di funzione ‘ in modo da renderla analoga a ‘ funzione di particolari ‘ , ed è proprio questo che causa problemi. Perché l’intervallo di valori di una funzione di particolari è assolutamente fissato dall’insieme dei particolari, una obbiettiva totalità a cui non ci si può sottrarre. Ma l’insieme di argomenti per una funzione di funzioni è un insieme di simboli che diventano proposizioni inserendo in essi il nome di un particolare. E questo insieme di simboli, reali o possibili, non è oggettivamente fisso, ma dipende dai nostri metodi di costruirli e richiede una  definizione più precisa.

Questa definizione può essere data in due modi, che possono essere distinti come metodo soggettivo e metodo oggettivo. Il metodo soggettivo 1 è quello adottato nei Principia Mathematica e consiste nel definire l’insieme delle funzioni come tutte quelle che possono essere costruite in un certo modo, in primo luogo dall’uso esclusivo del segno ‘ / ‘. Abbiamo visto come questo conduca all’impasse dell’Assioma di Riducibilità. Io, invece, adotterò il metodo oggettivo del tutto originale che ci porterà ad una teoria soddisfacente in cui non è richiesto un tale assioma. Questo metodo è quello di trattare funzioni di funzioni, per quanto possibile nello stesso modo come le funzioni di particolari. I segni che possono essere sostituiti come argomenti in ‘ φSchermata 2013-08-22 alle 18.42.59 ‘, una funzione di particolari, vengono determinati dai loro significati; questi devono essere nomi di particolari. Propongo analogamente di determinare i simboli che possono essere sostituiti come argomenti a ‘f(fi circonflessoSchermata 2013-08-22 alle 18.42.59) ‘ non per il modo della loro costruzione, ma per i loro significati. Questo è più difficile , perché le funzioni non significano singoli oggetti come accade per i nomi, ma hanno un significato in un modo più complicato derivato dai significati delle proposizioni che sono i loro valori. Il problema è in ultima analisi, di fissare come valori di f ( φSchermata 2013-08-22 alle 18.42.59) un qualche insieme definito di proposizioni in modo che possiamo affermare il loro prodotto logico e la loro somma logica. In Principia Mathematica sono definiti come tutte le proposizioni che possono essere costruite in un certo modo. Il mio metodo, invece, è quello di ignorare il modo in cui potremmo costruirle, e di determinarle per una descrizione o per il loro significato o rilevanza; e così facendo potremmo essere in grado di includere nell’insieme proposizioni che non abbiamo alcun modo di costruire, proprio come includiamo nell’insieme di valori di φx le proposizioni che non possiamo esprimere per la mancanza di nomi per i particolari che li riguardano.

1 Non vorrei stampare questo termine, io lo uso solo perché non riesco a trovarne uno migliore.

Dobbiamo iniziare la descrizione del nuovo metodo con la definizione di una funzione atomica di particolari, come risultato della sostituzione con variabili qualsiasi dei nomi di particolari in una proposizione atomica espressa utilizzando solo nomi; dove se si verifica un nome più di una volta nella proposizione può essere sostituito dalle stesse o diverse variabili, o lasciato solo nei diversi casi in cui occorre. I valori di una funzione atomica di particolari sono così proposizioni atomiche.

Poi estendiamo alle funzioni proposizionali il concetto di funzione verità – funzione delle proposizioni. (In un primo momento, naturalmente, le funzioni a cui lo estendiamo sono solo le proposizioni atomiche, ma l’estensione funziona anche in generale, e quindi lo stabilirò in generale.) Supponiamo di avere funzioni φ1 (Schermata 2013-08-22 alle 18.42.59 , y circonflesso ), φ2 ( Schermata 2013-08-22 alle 18.42.59 , y circonflesso ), ecc. , allora dicendo che una funzione ψ ( Schermata 2013-08-22 alle 18.42.59 ,y circonflesso ) è una certa funzione verità (ad esempio, la somma logica) delle funzioni φ1 (Schermata 2013-08-22 alle 18.42.59 , y circonflesso ) , φ2 ( Schermata 2013-08-22 alle 18.42.59 , y circonflesso ), ecc., e le proposizioni p, q, ecc., noi intendiamo che per qualsiasi valore di ψ (x , y), ad esempio ψ (a, b), è questa una funzione verità dei valori corrispondenti di φ1 ( x , y ), φ2 ( x , y ), ecc., cioè φ1 (a, b), φ2 (a, b), ecc., e le proposizioni p, q, ecc. Questa definizione ci permette di includere le funzioni tra gli argomenti di qualsiasi funzione verità, perché ci dà sempre una unica funzione che è la funzione verità di quegli argomenti; ad esempio la somma logica di φ1 (Schermata 2013-08-22 alle 18.42.59 ), φ2 ( Schermata 2013-08-22 alle 18.42.59 ) , … è determinata come ψ ( x ) , dove ψ ( a) è la somma logica di φ1 ( a) , φ2 ( a) , … , una proposizione definita per ogni a, in modo che ψ ( x ) è una funzione definita. Ed è unica perché, se ce ne fossero due, ossia ψ1 ( x ), e ψ2 ( x), ψ1 ( a) e ψ2 ( a) sarebbero per ciascuna a la stessa proposizione, e quindi le due funzioni sarebbero identiche.

Possiamo ora dare la definizione più importante di questa teoria, quella di una funzione predicativa. Io non uso questo termine nel senso di Principia Mathematica , 1a ed., perché quello che seguo è il lavoro successivo di Russell nell’uso di ‘ elementare ‘. Il concetto di una funzione predicativa, nel mio significato, è un significato che non compare nei Principia, e segna la differenza essenziale dei due metodi di procedere. Una funzione predicativa di particolari è una funzione che è una funzione verità di argomenti che, siano finiti o infiniti in numero, sono tutti o funzioni atomiche di particolari o di proposizioni.1 Questo definisce un insieme definito di funzioni di particolari che è più ampia di tutto l’insieme che si presenta nei Principia. Questo dipende essenzialmente dalla nozione di funzione verità di un numero infinito di argomenti; se ci potessero essere solo un numero finito di argomenti le nostre funzioni predicative sarebbero semplicemente le funzioni elementari dei Principia. L’ammettere un numero infinito implica che noi non definiamo un insieme di funzioni come quelle che potrebbero essere costruite in un determinato modo, ma lo determiniamo con una descrizione del loro significato. Queste devono essere le funzioni verità – non esplicitamente nel loro aspetto, ma nel loro significato – di funzioni atomiche e di proposizioni. In questo modo potremo includere molte funzioni che non abbiamo modo di costruire, e molte che costruiamo in modi molto diversi. Quindi , supponendo che φ (Schermata 2013-08-22 alle 18.42.59,y circonflesso) sia una funzione atomica, p una proposizione ,

φ ( Schermata 2013-08-22 alle 18.42.59 , y circonflesso ) , φ ( Schermata 2013-08-22 alle 18.42.59 , y circonflesso ) . v p , ( y) . φ ( x ^ , y)

sono tutte funzioni predicative. [ L’ultima è predicativa perché è il prodotto logico delle funzioni atomiche φ ( Schermata 2013-08-22 alle 18.42.59 , y ) per diversi valori di y.]

Per le funzioni di funzioni ci sono più o meno analoghe definizioni. In primo luogo, una funzione atomica di funzioni (predicative 2 ) di particolari e di una funzione atomica di particolari possono avere un solo argomento della funzione, ovvero φ , ma possono avere molti argomenti argomenti particolari, x , y , ecc. , e devono essere della forma φ ( x , y , … , a, b ​​, … ), dove ‘ a’, ‘b’ , … sono i nomi dei particolari.

1 Prima di ‘ proposizioni ‘ potrei inserire ‘ atomiche ‘ , senza restringere il significato della definizione. Perché ogni proposizione che è una funzione verità di proposizioni atomiche, e una funzione verità di una funzione verità è a sua volta una funzione verità.

2 Ho messo ‘ predicativo ‘ tra parentesi perché le definizioni si applicano nello stesso modo alle funzioni non – predicative trattate nel prossimo capitolo.

In particolare, una funzione atomica f ( φz circonflesso ) è nella forma φa. Una funzione predicativa di funzioni (predicative) di funzioni di particolari e di particolari è una funzione verità i cui argomenti sono tutti o proposizioni o funzioni atomiche di funzioni di funzioni di particolari e di particolari,

ad esempio,

fi circonflesso a .⊃. psi circonflesso b : v : p (a funzione di φ , ψ ),

( x ) . fi circonflessox , il prodotto logico delle funzioni atomiche fi circonflesso a , fi circonflesso b , ecc.

E’ chiaro che una funzione si presenta in una funzione predicativa solo attraverso i suoi valori. In questo modo possiamo procedere a definire le funzioni predicative di funzioni di funzioni e così via per ogni ordine.

Ora consideriamo una certa proposizione come ( φ ) . f ( φSchermata 2013-08-22 alle 18.42.59 ) dove f ( φSchermata 2013-08-22 alle 18.42.59 ) è una funzione predicativa di funzioni. Noi comprendiamo che l’intervallo dei valori di φ che sia tutto di funzioni predicative; vale a dire ( φ ) . f ( φSchermata 2013-08-22 alle 18.42.59 ) che è il prodotto logico delle proposizioni f ( φSchermata 2013-08-22 alle 18.42.59 ) per ogni funzione predicativa, e dal momento che questo è un insieme definito di proposizioni , abbiamo fornito a ( φ ) . f ( φSchermata 2013-08-22 alle 18.42.59 ) un significato preciso .

Consideriamo ora la funzione di x , ( φ ) , f ( φz circonflesso , x ) . Si tratta di una funzione predicativa ? E ‘ il prodotto logico della funzione proposizionale di x , f ( φz circonflesso , x ) per i diversi φ che, dal momento che f è predicativa , sono funzioni verità di φx e proposizioni, eventualmente, variabili in φ ma costanti in x (ad esempio φa). I φx, dal momento che le φ sono predicative, sono funzioni di verità delle funzioni atomiche di x. Quindi esse sono funzioni proposizionali di x , f ( φz circonflesso , x )  sono funzioni verità delle funzioni atomiche di x e proposizioni. Quindi esse sono funzioni predicative, e pertanto il loro prodotto logico ( φ ) , f ( φz circonflesso , x ) è predicativo. Più in generale è chiaro che per generalizzazione, qualunque sia il tipo di variabile apparente, non possiamo mai creare funzioni non – predicative; per la generalizzazione è una funzione verità dei suoi casi, e, se questi sono predicativi, così risulta questa.

Pertanto tutte le funzioni di particolari che si presentano nei Principia sono nel nostro significato predicative e comprese nella nostra variabile φ, in modo che tutto quello che necessita per l’Assioma di Riducibilità scompare.

Ma, si potrebbe obiettare, sicuramente in questo c’è un circolo vizioso; non è possibile includere FSchermata 2013-08-22 alle 18.42.59 = ( φ ) . f ( φz circonflesso , Schermata 2013-08-22 alle 18.42.59 ) tra i φ, perché presuppone la totalità delle φ. Questo non è, tuttavia , realmente un circolo vizioso . La proposizione Fa è certamente il prodotto logico delle proposizioni f ( φz circonflesso , a) , ma per esprimerla in questo modo (che è l’unico modo possibile in cui lo possiamo) è semplicemente quello di descriverla in un certo modo, con riferimento ad una totalità di cui può essere essa stessa un membro, così come possiamo fare riferimento a un uomo come il più alto in un gruppo, così identificandolo per mezzo di una totalità di cui egli stesso è un membro senza che vi sia alcun circolo vizioso. La proposizione Fa nel suo significato, cioè il fatto che afferma essere il caso, non comporta la totalità delle funzioni; è soltanto un nostro simbolo che la coinvolge. Per fare un caso particolarmente semplice, ( φ ) . φa è il prodotto logico delle proposizioni φa, di cui essa stessa è una proposizione; ma questo non è più notevole e non più circolo vizioso di quello che  è che è il fatto che p . q è il prodotto logico dell’insieme p , q , p . q , di cui esso stesso ne è membro. L’ unica differenza è che, a causa della nostra incapacità di scrivere proposizioni di lunghezza infinita, che è dal punto di vista logico un puro accidente, ( φ ) . φa non può, come p . q , essere elementarmente espresso, ma deve essere espresso come il prodotto logico di un insieme di cui ne è anche un membro. Se avessimo risorse infinite e potessimo esprimere tutte le funzioni atomiche come ψ1x , ψ2x , allora potremmo formare tutte le le proposizioni φa, cioè, tutte le funzioni verità di ψ1a, ψ2a, ecc. , e tra loro ci sarebbe quella che è il prodotto logico di tutte, compresa se stessa, proprio come p . q è il prodotto di p , q , p v q , p . q . Questa proposizione, che non possiamo esprimere direttamente, che è elementare, la esprimiamo indirettamente come il prodotto logico di tutte scrivendo ‘ ( φ ) . φa ‘. Questo è certamente un processo tortuoso, ma non c’è chiaramente nessun circolo vizioso al riguardo.

In questo sta il grande vantaggio del mio metodo su quello dei Principia Mathematica. In Principia l’insieme di φ è quello di funzioni che possono essere espresse elementarmente, e poiché ( φ ) . f ( φ ! z circonflesso , x ) non può essere espresso in tal modo non può esistere un valore di φ !; ma io definisco i valori di φ non per come possono essere espressi, ma solo per quale tipo di significato hanno i loro valori, o piuttosto, per come i fatti che i loro valori asseriscono di essere in relazione con i loro argomenti. Così includo le funzioni che non possono proprio essere da noi espresse del tutto, tranne solo elementarmente, ma solo per essere un sistema simbolico infinito . E qualsiasi funzione formata da generalizzazioni essendo effettivamente predicativa, non vi è più alcuna necessità di un Assioma di Riducibilità.

Resta da dimostrare che il mio concetto di funzioni predicativi non determini alcuna contraddizione. Le contraddizioni principali, come ho già detto in precedenza, contengono tutti alcune parole come “significa” , e devo dimostrare che queste sono causate da un’essenziale ambiguità di tali parole e non a qualche debolezza nella nozione di funzione predicativa.

Prendiamo per prima la contraddizione di Weyl su ‘ eterologica ‘ di cui abbiamo parlato nel precedente capitolo. È chiaro che la soluzione proposta lì non ci è più disponibile. Perché, come prima, se R è la relazione del significato tra ‘ φ ‘ e φSchermata 2013-08-22 alle 18.42.59 , ‘ x è eterologica ‘ è equivalente a ‘ (∃φ ) : xR ( φz circonflesso ) . ~ φx ‘ , l’insieme di φ essendo qui inteso come quello delle funzioni predicative. Allora,

( ∃ Φ ) : xR ( φz circonflesso ) . ~ φx ,

che chiamerò Fx , è essa stessa una funzione predicativa.

Così ‘ F ‘ R ( FSchermata 2013-08-22 alle 18.42.59 )

e ( ∃ φ ) : ‘F’ R ( φSchermata 2013-08-22 alle 18.42.59 ),

e quindi F ( ‘ F ‘) . ≣ . ~ F ( ‘ F ‘ ) ,

che è una contraddizione. Si vedrà che la contraddizione dipende essenzialmente dal dedurre ( ∃φ ) : ‘ F ‘ R ( φSchermata 2013-08-22 alle 18.42.59 ) da ‘ F ‘ R ( FSchermata 2013-08-22 alle 18.42.59 ) . Secondo i Principia Mathematica questa deduzione è illegittima perché FSchermata 2013-08-22 alle 18.42.59 non è un valore possibile di φSchermata 2013-08-22 alle 18.42.59 . Ma se l’insieme di φSchermata 2013-08-22 alle 18.42.59 è quello delle funzioni predicative, questa soluzione cade, dal momento che FSchermata 2013-08-22 alle 18.42.59 è certamente una funzione predicativa. Ma c’è ovviamente un’altra soluzione possibile – negare a ‘ F ‘ R ( FSchermata 2013-08-22 alle 18.42.59) la premessa della deduzione. ‘ F ‘ R ( FSchermata 2013-08-22 alle 18.42.59) afferma che ‘F’ significa FSchermata 2013-08-22 alle 18.42.59 . Ora, questo è certamente vero per alcuni significati di “significa”, così  per sostenere la nostra negazione di ciò dobbiamo mostrare una certa ambiguità nel significato di significato, e dire che il senso in cui ‘F’ significa FSchermata 2013-08-22 alle 18.42.59 , vale a dire che ‘ eterologico ‘ significa eterologico, non è il senso denotato con ‘ R ‘ , cioè il senso che si verifica nella definizione di eterologico. Si può facilmente dimostrare che questo è davvero il caso, in modo che la contraddizione è semplicemente dovuta ad una ambiguità nella parola ‘significato’ e non ha nessuna rilevanza per una qualunque matematica.

Prima di tutto, parlare di ‘ F ‘ col significato FSchermata 2013-08-22 alle 18.42.59 deve apparire del tutto molto strano secondo il punto di vista della definizione di funzione proposizionale come simbolo essa stessa. Ma l’espressione è semplicemente ellittica. Il fatto che cerchiamo di descrivere in questi termini è che noi abbiamo scelto arbitrariamente la lettera ‘ F ‘ per un determinato scopo , così che ‘ Fx ‘ avrà un certo significato (che dipende da x). Come risultato di questa scelta ‘ F ‘ , precedentemente senza significato, diventa significativa; essa ha significato. Ma è chiaramente una semplificazione impossibile supporre che vi è un singolo oggetto F, che significa ciò. Il suo significare è più complicato di questo, e deve essere ulteriormente approfondito .

Prendiamo il caso più semplice , una proposizione atomica completamente scritta per esteso, ‘ aSb ‘, dove ‘a’ , ‘ b ‘ sono nomi di particolari e ‘ S ‘ il nome di una relazione . Allora ‘a’ , ‘b’ , ‘ S ‘ significano nel modo più semplice i distinti oggetti ‘a’ ‘ b ‘ e ‘ S ‘. Ora supponiamo che definiamo

φx . = . aSx     Per definizione.

Allora ‘ φ ‘ è sostituito con ‘aS ‘ e non  significa un singolo oggetto, ma ha significato in un modo più complicato in virtù di una relazione a tre termini definita tra a e S. Allora possiamo dire ‘ φ ‘ significa aSx^, intendendo con questo che ‘φ’ ha questa relazione tra a e S. Possiamo estendere questo ragionamento per affrontare qualsiasi funzione elementare, cioè il dire che ‘ φ ! ‘ significa φ ! Schermata 2013-08-22 alle 18.42.59 significa che ‘ φ ! ‘ è in relazione in un certo modo con gli oggetti a, b , ecc. , coinvolti in φ ! Schermata 2013-08-22 alle 18.42.59.

Ma supponiamo ora di prendere un simbolo funzionale non – elementare, per esempio

φ1x : = : ( y) . yRx          Per definizione.

Qui gli oggetti coinvolti nel φ1Schermata 2013-08-22 alle 18.42.59 includono tutti i particolari come valori di y. Ed è chiaro che ‘ φ1’ non è correlato con questi in tutti gli stessi modi come ‘ φ ! ‘ lo è con gli oggetti nel loro modo di significare. Perché ‘ φ ! ‘è in relazione con a,b,  ecc. per l’essere una abbreviazione di un’espressione contenente i nomi di a,b, ecc.

Ma ‘ φ1 ‘ è l’abbreviazione di un’espressione che non contiene ‘a’ , ‘b’ , … , ma contiene solo una variabile apparente, di cui questi possono essere valori. Evidentemente ‘ φ1 ‘ significa ciò che significa in un certo modo diverso e più complicato da quello in cui ‘ φ ! ‘ significa. Naturalmente , proprio come elementare non è realmente una caratteristica della proposizione, questa in realtà non è una caratteristica della funzione; vale a dire , φ1Schermata 2013-08-22 alle 18.42.59 e φ ! Schermata 2013-08-22 alle 18.42.59 può essere la stessa funzione, perché φ1x è sempre la stessa proposizione come φ ! x . Allora ‘ φ1 ‘ , φ ! ‘ avranno lo stesso significato , ma lo significheranno, come abbiamo visto sopra, nel senso del tutto differente nel significato. Analogamente ‘ φ2 ‘ che coinvolge una variabile apparente funzionale avrà un significato in un modo differente e ancora più complicato.1

1 Qui il campo della variabile apparente ‘ φ2 ‘ è l’insieme delle funzioni predicative, non come in Principia Mathematica l’insieme delle funzioni elementari.

Perciò nella contraddizione che abbiamo discusso, se ‘ R ‘, il simbolo della relazione del significato tra ‘ φ ‘ e φSchermata 2013-08-22 alle 18.42.59 , deve avere un qualsiasi significato preciso, ‘ φ ‘ può essere solo un simbolo di un significato di un certo tipo che significa in un certo modo; supponiamo di limitare ‘ φ ‘ ad essere una funzione elementare assumendo che R sia la relazione tra ‘ φ ! ‘ e φ ! Schermata 2013-08-22 alle 18.42.59 .

Allora ‘ Fx ‘ o ‘ ( ∃ φ ) : xR ( φz circonflesso ) . ~ φx ‘ non è elementare , ma è un ‘ φ2‘ .

Quindi  ‘F’ significa non nel senso di significato indicato con ‘ R ‘ appropriato con ‘ φ !’ , ma in quello appropriato con un ‘ φ2 , così che abbiamo ~ : ‘ F’ R(FSchermata 2013-08-22 alle 18.42.59) che,come abbiamo spiegato sopra, risolve la contraddizione per questo caso.

Il punto fondamentale da capire è che la ragione per cui

( ∃ φ ) : ‘ F’R ( φSchermata 2013-08-22 alle 18.42.59 )

può essere vero solo se ‘ F ‘ è una funzione elementare, non è che l’insieme di φ è quello delle funzioni elementari, ma che un simbolo non può avere R per funzione a meno che esso (il  simbolo) sia elementare. La limitazione non deriva da ‘ ∃ φ , ‘ , ma da ‘ R ‘. Le distinzioni di ‘ φ ! ‘ , ‘ φ1, e ‘ φ2 si applicano ai simboli e al modo in cui assumono il significato, ma non a ciò che significano. Pertanto ho sempre (in questa sezione) incluso ‘ φ ! ‘ , ‘ Φ1 ‘ e ‘ φ2 ‘ tra virgolette.

Ma si potrebbe obiettare che questa è una soluzione incompleta; perché presuppone che assumiamo per R la somma delle appropriate relazioni tra, ‘ φ1 , ‘ φ2 e ‘ φ ! ‘ . Allora ‘ F “, dal momento che contiene ancora solo ∃φ, 1 è ancora un ‘ φ2 , e dobbiamo avere in questo caso ‘ F’R ( FSchermata 2013-08-22 alle 18.42.59 ), che distruggerebbe la nostra soluzione .

1 L’insieme di φ in ∃ φ è quello delle funzioni predicative, includendo tutte le ‘φ1‘, ‘ φ2’ , ecc. , così  non viene alterato cambiando R.

Ma non è così perché la complessità supplementare coinvolta nella nuova R determina che ‘ F ‘ non è un ‘ φ2 ‘, ma un simbolo ancora più complicato. Perché questa nuova R , per la quale ‘ φ2‘R ( φ2Schermata 2013-08-22 alle 18.42.59), dal momento che’ φ2x ‘ è in qualche forma come (∃ φ ) . f ( φz circonflesso , x ) , in  ( ∃ φ ) . ‘ F’R ( φSchermata 2013-08-22 alle 18.42.59 ) è coinvolta almeno in una funzione variabile f ( φz circonflesso , x ) di funzioni di particolari, per questo è coinvolta nella nozione della variabile ‘ φ2 ‘ , che è coinvolta nella variabile φ in congiunzione con R. Perché  se qualcosa ha R come funzione predicativa φSchermata 2013-08-22 alle 18.42.59,  φSchermata 2013-08-22 alle 18.42.59 deve essere esprimibile sia come una ‘ φ ! ‘ o ‘ φ1 ‘ o ‘ φ2 ‘.

Quindi ( ∃ φ ) . ‘ F’R ( φSchermata 2013-08-22 alle 18.42.59 ) coinvolge non soltanto la variabile φ(funzione predicativa di un particolare) ma anche una variabile f non evidente (funzione di una funzione di un particolare e di un particolare). Quindi ‘ Fx ‘ o ‘ ( ∃ φ ) : xR ( φSchermata 2013-08-22 alle 18.42.59 ) . ~ φx ‘non è un ‘ φ2 ‘ , ma quella che possiamo chiamare una ‘ φ3 ‘ , cioè una funzione di particolari che coinvolge una funzione variabile di funzioni di particolari. (Questo, naturalmente , non è la stessa cosa di una ‘ φ3 ‘ nel senso dei Principia Mathematica, 2a edizione ). Quindi ‘ F ha un significato in un modo più complicato tuttavia non incluso in R; e non abbiamo ‘ F ‘ R ( FSchermata 2013-08-22 alle 18.42.59 ) , così che la contraddizione scompare.

Quello che appare chiaramente dalle contraddizioni è che non possiamo avere una relazione che include ogni relazione di significato per le funzioni proposizionali. Qualunque cosa noi assumiamo qui c’è tuttavia un modo di costruire un simbolo per dare un significato in modo non incluso nella nostra relazione. I significati di significato formano una totalità illegittima.

Con il processo iniziato qui sopra si ottiene una gerarchia di proposizioni e una gerarchia di funzioni di particolari. Entrambe sono basate sulla gerarchia fondamentale di particolari, funzioni di particolari, funzioni di funzioni di particolari, ecc. Chiameremo una funzione di particolari una funzione di tipo 1; chiameremo una funzione di funzioni di particolari, una funzione di tipo 2, e così via.

Ora costruiamo la gerarchia delle proposizioni come segue :

Proposizioni di ordine 0 (elementari), che non contengono variabili apparenti.

Proposizioni di ordine 1, contenenti una variabile apparente particolare.

Proposizioni di ordine 2, contenenti una variabile apparente variabile i cui valori sono funzioni di tipo 1.

Proposizioni di ordine n, contenenti una variabile apparente i cui valori sono funzioni di tipo n – 1.

Da questa gerarchia si deduce un’altra gerarchia di funzioni, indipendentemente dai loro tipi, secondo l’ordine dei loro valori.

Così funzioni di ordine 0 ( matrici ) non contengono nessuna variabile apparente ;

Così funzioni di ordine 1, contengono una variabile particolare apparente ;

e così via; cioè i valori di una funzione di ordine n sono proposizioni di ordine n. Per questa classificazione i tipi delle funzioni sono senza importanza.

Dobbiamo sottolineare la fondamentale distinzione tra ordine e tipo. Il tipo di una funzione è una caratteristica reale di esso che dipende dagli argomenti che assume; ma l’ordine di una proposizione o di una funzione non è una caratteristica reale, ma quello che Peano chiamava pseudo – funzione. L’ordine di una proposizione è come il numeratore di una frazione. Proprio come da ‘ x = y’ , non possiamo dedurre che il numeratore di x è uguale al numeratore di y, dal fatto che ‘ p ‘ e ‘ q ‘ sono casi della stessa proposizione non possiamo dedurre che l’ordine di’ p ‘ sia uguale a quello di ‘ q ‘. Ciò è stato dimostrato sopra (p. 34) per il caso particolare di proposizioni elementari e non elementari (Ordini 0 e > 0 ), e resta valido ovviamente in generale. L’ordine è solo una caratteristica di un particolare simbolo che è un caso della proposizione o  della funzione.

Mostreremo brevemente come questa teoria risolve le restanti contraddizioni del gruppo B.1

1 Può essere bene ripetere che per le contraddizioni del gruppo A la mia teoria salvaguarda le soluzioni fornite in Principia Mathematica .

( a) ‘ sto mentendo ‘ .

Questo dovremmo analizzarlo come ‘ ( ∃ “p ” , p ): Sto dicendo “p” . ” p” significa p . ~ p ‘. Qui per ottenere un significato definito per significato 1 è necessario limitare in qualche modo l’ordine di ‘p’. Supponiamo ‘ p ‘ essere dell’ordine ennesimo o minore. Allora indicando col simbolo φn  una funzione del tipo n, ‘p’ può essere ( ∃ φn ) . φn + 1n ) .

Quindi ∃ ’ p ‘ implica ∃ φn + 1 , e ‘Io sto mentendo ‘ nel senso di ‘ io sto asserendo una proposizione falsa di ordine n ‘ è almeno di ordine n + 1 e non contraddice sé stessa.

( b) ( 1 ) Il minimo intero non nominabile in meno di diciannove sillabe .

( 2 ) Il minimo ordinale indefinibile.

( 3 ) Il paradosso di Richard.

Tutti questi derivano dalla ambiguità evidente di ‘ nominare ‘ e ‘ definire ‘. Il nome o la definizione è in ogni caso un simbolo funzionale, che è solo un nome o una definizione per significare qualcosa. Il senso per cui significa deve essere dato in modo preciso fissandone l’ordine; il nome o la definizione che coinvolga tutti questi nomi e definizioni saranno di ordine superiore, e questo rimuove la contraddizione. Le mie soluzioni di queste contraddizioni sono ovviamente molto simili a quelle di Whitehead e Russell, la differenza tra queste si verifica solo nelle nostre diverse concezioni dell’ordine delle proposizioni e delle funzioni. Per me proposizioni in sé non hanno ordini; ma sono solo diverse funzioni verità delle proposizioni atomiche – una totalità definita, che dipende da quali proposizioni atomiche ci sono.

1 Quando dico ” ‘p’ significa p” , non intendo che ci sia un singolo oggetto p che significa ‘ p ‘. Il significato di ‘ p ‘ è quello che una di un certo insieme di possibilità si verifichi, e questo significato risulta dalle relazioni di significato dei distinti segni in ‘ p ‘  con gli oggetti reali che li riguardano. Sono queste relazioni di significato che variano con l’ordine di ‘ p ‘. E l’ordine di ‘ p ‘ è limitato non perché p in (∃ p ) è limitato, ma a causa del ‘significato ‘che varia in significato con l’ordine di ‘ p ‘ .

Ordini e totalità illegittime risultano solo con i simboli che usiamo per fornire un simbolo di fatti in modi variamente complicati.

Per riassumere : in questo capitolo ho definito una serie di funzioni predicative che sfuggono alla  contraddizione e ci permettono di fare a meno dell’Assioma di Riducibilità. E ho dato una soluzione delle contraddizioni del gruppo B, che poggia e spiega il fatto che tutte contengono qualche elemento epistemico.

Principia Mathematica – Cap. 2 di The Foundation of Mathematics di Frank P. Ramsey

14 Mag

Pacioli_1Riporto di seguito la traduzione del secondo capitolo della prima parte delle opere di F.P. Ramsey,  come pubblicate in The Foundation of Mathematics a cura di R.B. Braithwaite nella sezione I capitolo II, con il titolo Principia Mathematica.

 

II . Principia Mathematica

Nel precedente capitolo ho cercato di spiegare le difficoltà che affronterebbe la teoria che le proposizioni della matematica sono tautologie; in questo dobbiamo discutere la tentata soluzione di queste difficoltà fornite in Principia Mathematica. Cercherò di dimostrare che questa soluzione ha tre importanti difetti, e il resto di questo saggio sarà dedicato ad esporre una teoria modificata dalla quale sono stati rimossi questi difetti.

La teoria dei Principia Mathematica è che ogni classe o aggregato (io uso le parole come sinonimi) è definito da una funzione proposizionale – cioè, consiste dei valori di x per cui ‘ φx ‘ è vera, dove ‘φx ‘ è un simbolo che esprime una proposizione se qualche simbolo di tipo adeguato venga sostituito ad ‘ x ‘. Ciò equivale a dire che ogni classe ha una proprietà definita. Prendiamo la classe costituita da a e b; perché, ci si può chiedere, ci deve essere una funzione φx ^ tale che ‘ φa ‘, ‘φb’ sono vere , ma tutti gli altri ‘ φx falsi ? A questo viene risposto dando come funzione ‘ x = a . v . x = b ‘. Trascuriamo al momento le difficoltà connesse con l’identità, e accettiamo questa risposta; essa ci mostra che ogni classe finita è definita da una funzione proposizionale costruita per mezzo di un’identità; ma per quanto riguarda le classi infinite ci lascia esattamente dove eravamo prima, cioè, senza alcun motivo di supporre che esse siano tutte definite da funzioni proposizionali,  perché è impossibile scrivere una serie infinita di identità. A questo si potrebbe rispondere che una classe ci può essere data soltanto o per enumerazione dei suoi membri, nel qual caso deve essere finita, o dando una funzione proposizionale che la definisce. In modo che non possiamo essere in alcun modo interessati da classi o aggregati infiniti, se tali esistano, che non sono definiti da funzioni proposizionali. 1 Ma questo argomento contiene un errore comune, perché presuppone che, perché non possiamo considerare un oggetto individualmente, non possiamo avere alcun interesse su questo. Quindi, anche se una classe indefinibile infinita non può essere citata per sé, è comunque coinvolta in qualsiasi formulazione che inizia ‘Tutte le classi’ o ‘C’è una classe tale che’, e se si escludono le classi indefinibili il significato di tutte queste formulazioni sarebbe fondamentalmente alterato.

1 Per brevità chiamerò «classi indefinibili ‘ tali classi .

E’ una questione empirica se esistono classi indefinibili o meno; entrambe le possibilità sono perfettamente ammissibili. Ma anche se, in realtà , tutte le classi sono definibili, non possiamo nella nostra logica identificare le classi con le classi definibili senza distruggere l’apriorità e la necessità che è l’essenza della logica. Ma nel caso qualcuno pensi ancora che per classi intendiamo classi definibili, e da ‘ C’è una classe ‘ , ‘ C’è una classe definibile ‘, consideri la seguente spiegazione. Questa spiegazione non riguarda esattamente questo problema, ma il problema corrispondente per due variabili – l’esistenza di relazioni in estensione non definibili per funzioni proposizionali di due variabili. Ma questo problema è chiaramente così simile all’altro che le risposte ad entrambi devono essere le stesse.

Si consideri la proposizione ‘Schermata 2013-08-22 alle 18.42.59 ( φx ) sm Schermata 2013-08-22 alle 18.42.59 ( ψx ) ‘ ( cioè la classe definita da φ Schermata 2013-08-22 alle 18.42.59 ha lo stesso cardinale di quella definita dalla ψ Schermata 2013-08-22 alle 18.42.59 ); questo è definito per indicare che vi è una relazione biunivoca in estensione il cui dominio è Schermata 2013-08-22 alle 18.42.59 ( φx ) e il cui dominio inverso è Schermata 2013-08-22 alle 18.42.59 ( ψx ) . Ora, se per relazione in estensione intendiamo una relazione in estensione definibile, ciò significa che due classi hanno lo stesso cardinale solo quando vi è una relazione reale o funzione f ( x , y ) che determinano una correlazione tra loro termine per termine. Invece evidentemente quello che intendeva Cantor, che per primo ha dato questa definizione, era semplicemente che le due classi erano tali da poter essere correlate, non che ci deve essere una funzione proposizionale che effettivamente le mettesse in correlazione.1 Così le classi di angeli maschio e femmina possono essere infinite e in numero uguale, in modo che sarebbe possibile accoppiarle completamente tra maschio e femmina, senza che vi sia alcuna relazione reale come il matrimonio che le metta in correlazione. La possibilità di classi indefinibili e relazioni in estensione è una parte essenziale del modo di essere estensionale della matematica moderna, che ho sottolineato nel capitolo I, e che è stata trascurato nei Principia Mathematica ed è il primo dei tre grandi difetti di quest’opera. L’errore si verifica non avendo una proposizione primitiva che afferma che tutte le classi sono definibili, ma dando una definizione di classe che si applica solo alle classi definibili, in modo che tutte le proposizioni matematiche su alcune o su tutte le classi vengono fraintesi.

1 Cf . W. E. Johnson , Logic Part II (1922), p. 159.

Questa errata interpretazione non è solo discutibile nella sua formulazione nel modo generale, ma è particolarmente perniciosa in relazione con l’Assioma Moltiplicativo, che è una tautologia se correttamente interpretato, ma quando frainteso dopo la modalità dei Principia Mathematica diventa una proposizione empirica significativa, che non vi è alcuna ragione di supporre vera. Questo sarà mostrato nel capitolo V.

Il secondo difetto dei Principia Mathematica rappresenta un fallimento per non superare, come il primo, le difficoltà sollevate dall’estensionalità della matematica, ma quelle sollevate dalle contraddizioni discusse alla fine del capitolo I. Si è proposto di togliere queste contraddizioni da quella che è chiamata la Teoria dei Tipi, che consiste in realtà di due parti distinte dirette rispettivamente contro i due gruppi di contraddizioni. Queste due parti sono state unificate dall’essere entrambe dedotte in modo piuttosto sciatto dal ‘ principio del circolo vizioso ‘, ma mi sembra essenziale considerarle separatamente.

Le contraddizioni del gruppo A sono rimosse sottolineando che una funzione proposizionale significativa non può prendere se stessa come argomento, e dividendo le funzioni e le classi in una gerarchia di tipi in base ai loro possibili argomenti. Pertanto, l’affermazione che una classe è un membro di se stesso non è né vero né falso, ma privo di significato . Questa parte della teoria dei tipi mi sembra indiscutibilmente corretta, e io non la discuto ulteriormente.

La prima parte della teoria, poi, distingue i tipi di funzioni proposizionali in base ai loro argomenti; così ci sono funzioni di particolari, funzioni di funzioni di particolari, e così via . La seconda parte pensata per soddisfare il secondo gruppo di contraddizioni richiede ulteriori distinzioni tra le diverse funzioni che assumono gli stessi argomenti, per esempio tra le diverse funzioni di particolari. La seguente spiegazione di queste distinzioni si basa sulla Introduzione alla seconda edizione dei Principia Mathematica.

Cominciamo con proposizioni atomiche, che sono state illustrate nel capitolo I. Da queste mediante la barra (p / q = non entrambe p e q sono vere) possiamo costruire qualsiasi funzione verità di un numero finito di proposizioni atomiche come argomenti. L’assemblaggio delle proposizioni così ottenute è chiamato proposizioni elementari. Sostituendo una variabile con il nome di un particolare in una o più delle sue occorrenze in una proposizione elementare si ottiene una funzione elementare di particolari. Una funzione elementare di particolari, ‘ φ Schermata 2013-08-22 alle 18.42.59 , ‘ è quindi una i cui valori sono proposizioni elementari, cioè, funzioni verità di un numero finito di proposizioni atomiche. Tali funzioni sono state chiamate, nella prima edizione dei Principia Mathematica, funzioni predicative. Parleremo di queste con un loro nuovo nome, e nel prossimo capitolo useremo ‘ la funzione predicativa ‘ in un nuovo e originale significato, che mi sembra più appropriato. In generale, una funzione elementare o matrice di una o più variabili, siano esse particolari o meno, è una i cui valori sono proposizioni elementari. Le matrici sono denotate da un punto esclamativo dopo il simbolo funzionale . Così ‘ F ! ( fi circonflesso ! z circonflesso , psi circonflesso !z circonflesso , Schermata 2013-08-22 alle 18.42.59 , y circonflesso) ‘ è una matrice con due particolari e due funzioni elementari di particolari come argomenti .

Da una funzione elementare ‘ φ ! Schermata 2013-08-22 alle 18.42.59 ‘ si ottengono, come nel Capitolo I , le proposizioni ‘ ( x ) . φ ! x ‘ e ( ∃x ) . φ ! x’ che rispettivamente affermano la verità di tutti e di almeno uno dei valori di ‘φ ! x’. Analogamente da una funzione elementare di due particolari φ ! (Schermata 2013-08-22 alle 18.42.59 ,y circonflesso ) otteniamo funzioni di un particolare come ( y) . Φ ! (Schermata 2013-08-22 alle 18.42.59 , y ) , (∃ y ) . φ ! ( Schermata 2013-08-22 alle 18.42.59 , y ) . I valori di queste funzioni sono proposizioni come ( y) φ ! (a, y) che non sono proposizioni elementari; quindi le funzioni stesse non sono funzioni elementari. Tali funzioni, i cui valori derivano dalla generalizzazione di una matrice i cui valori tutti sono particolari, sono chiamati funzioni di primo ordine, e scritte φ1Schermata 2013-08-22 alle 18.42.59.

Supponiamo che a sia una costante. Allora ‘ φ ! a ‘ Indicherà per i vari valori di φ tutte le varie proposizioni elementari ” φ ” , di cui a è un costituente. Possiamo quindi formare le proposizioni (φ) . φ ! a, (∃ φ ) . ! φa che affermano rispettivamente la verità di tutte, e di almeno una dell’assemblaggio di proposizioni di cui sopra. Più in generale possiamo affermare scrivendo ( φ ) . F ! ( !  φz circonflesso ) , ( ∃φ ) . F ! ( φ ! z circonflesso ). Tali proposizioni non sono evidentemente elementari, in modo che una funzione come ( φ ) . F ! ( φ ! z circonflesso , x ) non è una funzione elementare di x. Tale funzione che coinvolge la totalità delle funzioni elementari si dice del secondo ordine e scritta φ2x . Con l’adozione della nuova variabile φ2 ” otterremo altre nuove funzioni

( φ2 ) . f ! ( φ2 z circonflesso , x ) , ( ∃ φ2 ) . f ! ( φ2z circonflesso , x ) ,

che ancora non sono tra valori perfi circonflesso2  x (dove φ2 è l’argomento), perché la totalità dei valori di φ2 z circonflesso , che ora è coinvolto , è diversa dalla totalità dei valori di φ ! z circonflesso , che precedentemente era coinvolta. Per quanto possiamo allargare il significato di φ, una funzione di x in cui si verifica φ come variabile apparente ha un significato corrispondentemente allargato, in modo tale che, comunque φ può essere definita , ( φ ) . f ! ( φz circonflesso , x ) e (∃ φ ) . f ! ( φz circonflesso , x ) non possono mai essere valori di φx. Il tentare di renderli così è come cercare di prendere la propria ombra. È impossibile ottenere una variabile che abbraccia fra i suoi valori tutte le possibili funzioni di particolari. ” 1

1 Principia Mathematica, 1, 2a ed ., (1925), p. XXXIV.

Per il modo in cui viene utilizzata la distinzione di funzioni in ordini di cui non è possibile usarne la totalità al fine di sfuggire alle contraddizioni del gruppo B, che sono evidenziate come derivanti dalle ambiguità del linguaggio che non ammette questa distinzione, si può fare riferimento ai Principia Mathematica.1 Qui può essere sufficiente applicare il metodo a una contraddizione non data in quell’opera che è particolarmente priva di elementi poco significativi: voglio dire la contraddizione di Weyl riguardante ” eterologo ‘, 2 che deve ora essere spiegata. Alcuni aggettivi hanno significati che sono predicati della parola stessa aggettivo, così la parola ‘ breve ‘ è breve , ma la parola ‘ lungo ‘ non è lunga . Chiamiamo gli aggettivi i cui significati sono predicati di essi, come ‘ corto ‘ , autologici , gli altri eterologici . Ora è eterologico ‘ eterologico ‘ ? Se lo è, il suo significato non è un predicato di esso, cioè , non è eterologico . Ma se non è eterologico , il suo significato è un predicato di esso, e quindi è eterologico. Quindi abbiamo una assoluta contraddizione.

Secondo i principi di Principia Mathematica questa contraddizione verrebbe risolta nel modo seguente. Una parola aggettivo è il simbolo per una funzione proposizionale, ad esempio, ‘ φ ‘ per φSchermata 2013-08-22 alle 18.42.59. Sia R la relazione di significato tra ‘ φ e ‘ φSchermata 2013-08-22 alle 18.42.59 ‘. Allora ‘ w è eterologica ‘ è ‘ ( ∃ φ ) . wR (φSchermata 2013-08-22 alle 18.42.59) . ~ φw ‘. In questo , come abbiamo visto, la variabile apparente φ deve avere un intervallo definito di valori (ad esempio la gamma delle funzioni elementari ) , di cui Fx = : . (∃ Φ ) :  xR (φx^). ~ φx non può essere membro di sé stessa. In modo che ‘ eterologico ‘ o ‘ F ‘ non è di per sé un aggettivo nel senso in cui lo è ‘ φ ‘. Non abbiamo ( ∃ φ ) . ‘ F’R ( φSchermata 2013-08-22 alle 18.42.59 ), perché il significato di’ F ‘ non è una funzione inclusa nell’insieme di ‘ φ ‘. Così che quando eterologico e autologico siano definite in modo non ambiguo, ‘ eterologico ‘ non è un aggettivo nel senso in esame, e non è né eterologico né autologico, e non vi è nessuna contraddizione.

1 Principia Mathematica, 1, 1a ed., (1910), p. 117.

2 Weyl, Das Kontinuum, p. 2.

Così questa teoria di una gerarchia di ordini di funzioni di particolari sfugge alle contraddizioni; ma ci getta in una altrettanto seria, perché rende non validi molti importanti argomenti matematici che sembrano contenere esattamente la stessa fallacia come le contraddizioni. Nella prima edizione dei Principia Mathematica è stato proposto di giustificare queste argomentazioni con un particolare assioma, l’Assioma di Riducibilità, che affermava che per ogni funzione non elementare c’è una equivalente funzione elementare. 1 Non c’è ragione per ritenere vero questo assioma; e, se fosse vero, questo sarebbe un caso favorevole e non una necessità logica, perché non è una tautologia. Questo verrà mostrato concretamente nel Capitolo V; ma per il momento dovrebbe essere sufficiente che esso non sembra essere una tautologia e che non vi è alcun motivo di ritenere che sia una tautologia. Una tale assioma non ha posto nella matematica, e tutto ciò che non può essere provato senza l’utilizzo di esso non può essere considerato del tutto come dimostrato.

Vale forse la pena, tra parentesi, notare un punto che a volte è omesso. Perché, ci si può chiedere, l’Assioma di Riducibilità non riproduce le contraddizioni che la distinzione tra funzioni elementari e le altre funzione eviterebbe ? Perché essa afferma che per qualsiasi funzione non elementare esiste una funzione elementare equivalente, e così apparirebbe di aver perso di nuovo ciò che era stato guadagnato facendo la distinzione. Questo non è, tuttavia, il caso, dovuto alla natura peculiare delle contraddizioni in questione; perché, come si è detto in precedenza, questa seconda serie di contraddizioni non sono puramente matematiche, ma coinvolgono tutte le idee di pensiero o di significato, in rapporto alle quali le funzioni equivalenti funzioni (nel senso di equivalente come spiegato sopra) non sono intercambiabili; per esempio, uno può indicare mediante o una certa parola o un certo simbolo, ma non l’altro, e uno può essere definibile, e non l’altro. 2

1 Due funzioni sono chiamate equivalenti quando gli stessi argomenti le rendono entrambe vere o entrambe false. (Umfangsgleich tedesco).

2 il dr. L. Chwistek sembra aver trascurato questo punto che, se una funzione è definibile, la funzione elementare equivalente non occorre che sia anche definibile nei termini di simboli dati. Nel suo articolo ” Uber die Antinomiem de Prinzipien der Mathematik ” in Math. Zeitschrift, 14, (1922), pp. 236-243, egli denota con S una relazione molti – uno fra i numeri naturali e le classi definite dalle funzioni definibili in termini di certi simboli. Essendo φz circonflesso una funzione non – elementare di questo tipo, egli conclude che ci deve essere un n tale che nSz circonflesso ( φz ) . Questo è, tuttavia, un errore, poiché nSz circonflesso ( φz ), significa per definizione (∃ ψ ) : ψ ! x ≣ x φx . nS (ψ ! z circonflesso )

e poiché ψ ! z circonflesso non è necessariamente definibile nei termini dei simboli dati, non c’è motivo per essere tale per ogni n.

D’altra parte , qualsiasi contraddizione puramente matematica che nasce dalla confusione di funzioni elementari e funzioni non elementari sarebbe ripristinata dall’Assioma di Riducibilità, a causa della natura estensionale della matematica, in cui le funzioni equivalenti sono intercambiabili. Ma una tale contraddizione non ha mostrato di verificarsi, in modo che l’ assioma di riducibilità non sembra essere auto – contraddittorio. Queste considerazioni mettono in evidenza chiaramente la particolarità di questo secondo gruppo di contraddizioni, e rendono ancora più probabile che abbiano una soluzione psicologica o epistemologica e non puramente logica o matematica; così che qui ci sarebbe qualcosa di sbagliato nella valutazione della questione proposta in Principia.

I principali metodi matematici che sembrano richiedere l’Assioma di Riducibilità sono l’induzione matematica e la sezione Dedekindiana, le basi essenziali dell’aritmetica e dell’analisi rispettivamente. Russell è riuscito a fare a meno dell’assioma nel primo caso, 1 ma non offre speranza di un simile simile successo nel secondo. La sezione dedicata a Dedekind è quindi lasciata come un metodo essenzialmente imperfetto, come è stato spesso sottolineato da Weyl, 2 e l’analisi ordinaria si sbriciola in polvere. Che queste siano le sue conseguenze è il secondo difetto nella teoria dei Principia Mathematica, e, a mio avviso, una prova assolutamente inconfutabile che c’è qualcosa di sbagliato. Per quanto possa né accettare l’ Assioma di Riducibilità, né rifiutare l’analisi ordinaria, non posso credere in una teoria che mi si presenta senza una terza possibilità .

1 Cfr. Principia Mathematica , I, 2a ed., (1925), Appendice B.

2 Cfr. H. Weyl, Das Kontinuum e ” Uber die neue Grudlagenkrise der Mathematik ” Math. Zeitschrift, 10 (1921), pp. 39-79.

Il terzo grave difetto in Principia Mathematica è il trattamento dell’identità. È opportuno precisare che ciò che si intende è l’identità numerica, identità nel senso di contare come uno, non come due elementi. Di questa  viene data la seguente definizione:

‘ x = y . = : (φ) : φ ! x. ⊃. φ ! y : Per definizione ‘1

Cioè, due oggetti sono identici se hanno tutte le loro proprietà elementari in comune.

In Principia questa definizione si  afferma dipendere dall’Assioma di Riducibilità, perché, a parte questo assioma, due oggetti potrebbero avere tutte le loro proprietà elementari in comune, ma anche discordare per quanto riguarda le funzioni di ordine superiore, nel qual caso non potrebbero essere considerati numericamente identici. 2 Anche se , come vedremo , la definizione deve essere respinta su altre basi, non credo che dipenda in questo modo dall’Assioma di Riducibilità. Perché anche respingendo l’Assioma di Riducibilità distrugge l’ evidente prova generale che due cose che concordano in relazione a tutte le funzioni elementari concordano anche nei confronti di tutte le altre funzioni, penso che questo anche seguirebbe e probabilmente sarebbe provato

in qualsiasi caso particolare.

1 13.01

2 Principia Mathematica, I, 1a ed. (1910), 177.

 

Per esempio, prendiamo le tipiche funzioni del secondo ordine

 

( φ ) . f ! ( φ ! z circonflesso , x ) , ( ∃ φ ) . f ! ( φ ! z circonflesso , x )

Quindi , se abbiamo ( φ ) : φ ! x . ≣ . φ ! y       ( x = y ) ,

ne consegue che ( φ ) : f ! ( φ ! z circonflesso , x ) . ≣ . f ! ( φ ! z circonflesso , y) , perché f ! ( φ ! z circonflesso, x ) è una funzione elementare di x. Da cui

( φ ) . f ! ( φ ! z circonflesso , x ) : ≣ : ( φ ) . f ! ( φ ! z circonflesso , y)

e

( ∃ φ ) . f ! ( φ ! z circonflesso , x ) : ≣ : ( ∃φ ) . f ! ( φ ! z circonflesso, y) .

 

Quindi rifiutando l’Assioma di Riducibilità non porta immediatamente al rigetto della definizione dell’identità .

La vera obiezione a questa definizione dell’identità è la stessa che ci ha spinto contro la definizione di classi come classi definibili: che è un errore di interpretazione in quanto non definisce il significato con cui viene effettivamente utilizzato il simbolo di identità. Questo può essere facilmente osservato nel seguente modo: la definizione risulta autocontraddittoria per due oggetti che hanno tutte le loro proprietà elementari in comune. Eppure questo è davvero veramente possibile, anche se, in effetti, non si verifica mai. Prendete due oggetti, a e b . Allora non vi è nulla di auto contraddittorio in a che ha un qualsiasi insieme autocoerente di proprietà elementari, né in b che ha questo insieme, né ovviamente in a e b che lo abbiano, né quindi in a e b che abbiano tutte le loro proprietà elementari in comune. Quindi, dal momento che questo è logicamente possibile, è essenziale disporre di un simbolismo che ci permette di considerare questa possibilità e non escluderla per definizione .

È inutile sollevare l’obiezione che non è possibile distinguere due cose che hanno tutte le loro proprietà in comune, dal momento che il dare loro nomi diversi implicherebbe che avrebbero le differenti proprietà di avere quei nomi. Infatti, anche se questo è perfettamente vero – vale a dire , non posso, per le ragioni esposte, conoscere qualsiasi due oggetti particolari indistinguibili – ma posso benissimo prendere in considerazione la possibilità, o anche sapere che ci sono due oggetti indistinguibili senza sapere che esistano. Per prendere in considerazione una situazione analoga: dal momento che ci sono più persone sulla terra rispetto ai capelli sulla testa di una persona qualsiasi, so che ci devono essere almeno due persone con lo stesso numero di capelli, ma non so di quali persone si tratti.

Questi argomenti sono rafforzati dalla scoperta di Wittgenstein che il segno di identità non è un  necessaria componente della notazione logica, ma può essere sostituito dalla convenzione che segni differenti debbano avere significati differenti. Questo può essere trovato nel Tractatus logico-philosophicus, p. 139; la convenzione è leggermente ambigua, ma può essere reso precisa, ed è altresì praticabile, anche se generalmente scomoda. Ma anche se non avesse nessun altro valore, fornisce una prova efficace che l’identità può essere sostituita da una convenzione simbolica, e non è quindi una vera funzione proposizionale, ma semplicemente un espediente logico.

Concludiamo, quindi, che il trattamento dell’identità in Principia Mathematica è un fraintendimento della matematica, e proprio come la definizione errata di classi è particolarmente sfortunata in connessione con l’Assioma Moltiplicativo, così la definizione errata di identità è particolarmente fuorviante per quanto riguarda l’Assioma dell’Infinito; perché le due proposizioni ‘ Ci sono un numero infinito di oggetti ‘ e ‘ Ci sono un numero infinito di oggetti diversi tra loro per quanto riguarda le funzioni elementari ‘ sono, come vedremo nel Capitolo V, estremamente differenti tra loro.

ON THERE BEING NO DISCUSSABLE SUBJECT

21 Dic

Frank_Plumpton_RamseyPropongo la  traduzione di questo articolo di Frank Ramsey letto alla Apostles Society di Cambridge il 28 Febbraio 1925. Il testo è stato pubblicato dalla prof.ssa Maria Carla Galavotti nel libro Notes on Philosophy, Probability and Mathematics ed. Bibliopolis. Al termine riporto la trattazione in lingua originale.

NON C’E’ NESSUN SOGGETTO DA DISCUTERE 1

1 Questo articolo è stato pubblicato anche con il titolo «Epilogo» in FM, pp. 287-292 e ristampato in PP, pp. 245-250. La presente trascrizione è più vicina all’originale.

28 febbraio 1925

Dovendo scrivere un articolo per la Società ero come al solito a corto di soggetto; e mi sono lusingato che questa non era soltanto la mia carenza personale, ma che nascesse dal fatto che non c’era davvero nessun soggetto adatto per la discussione. Ma mi è successo di aver recentemente tenuto una conferenze sulla Teoria dei Tipi ho riflettuto che in una frase la parola “soggetto” deve essere limitata a significare “soggetto” del primo ordine e che forse potrebbe esserci un soggetto di secondo ordine che potrebbe essere possibile. E poi ho visto che si trovava pronto davanti a me, cioè che devo proporre la tesi che non esiste un soggetto discutibile (del 1° ordine).

Una questione seria questa se fosse vero. Perché per cosa esiste la società se non per la discussione? e se non c’è nulla da discutere, ma questo può essere lasciato al seguito.

Non voglio sostenere che non c’è mai stato nulla da discutere; ma solo che non c’è più; che abbiamo davvero tutto risolto; rendendoci conto che non c’è niente da conoscere, tranne la scienza. E che la maggior parte di noi ignora la maggior parte delle scienze in modo che, mentre siamo in grado di scambiare informazioni non possiamo utilmente  discuterle, dal momento che noi siamo solo discenti.

Rivediamo i possibili argomenti di discussione. Ricadono per quanto posso vedere sotto i capitoli della scienza, filosofia, storia e politica, psicologia ed estetica; dove, non per dare qualcosa per scontato, sto separando la psicologia dalle altre scienze.

Scienza, storia e politica non sono adatti per la discussione se non da esperti. Le altre sono semplicemente nella posizione di richiedere ulteriori informazioni, e fino a quando non avremo acquisito tutte le informazioni disponibili, non possiamo fare altro che accettare per autorità le opinioni di quelli più qualificati.

Poi c’è la filosofia, anche questa è diventata troppo tecnica per i profani. Oltre questo inconveniente, la conclusione del più grande filosofo moderno è che non esiste un certo soggetto come la filosofia, che è una attività non una dottrina, e che invece di rispondere a domande, mira semplicemente a curare il mal di testa. Si potrebbe pensare che, a parte questa filosofia tecnica il cui centro è la logica, c’è stata una sorta di filosofia popolare che trattava temi come il rapporto dell’uomo con la natura e il senso della morale. Ma ogni tentativo di trattare in modo serio tali argomenti li riduce a problemi o della scienza o della filosofia tecnica, o più immediatamente determina il risultato di farle riconoscere essere prive di senso.

Prendete come esempio la conferenza straordinaria del nostro fratello Russell su ciò in cui credeva. L’ha divisa in due parti, la filosofia della natura e la filosofia del valore. La sua filosofia della natura consisteva principalmente nelle conclusioni della moderna fisica, fisiologia e astronomia  con una leggera aggiunta di una sua personale teoria degli oggetti materiali come un particolare tipo di costruzione logica. Il suo contenuto potrebbe quindi essere discusso solo da qualcuno con una conoscenza adeguata della relatività, la teoria atomica, la fisiologia e la logica matematica. L’ unica possibilità residua di discussione in relazione a questa parte del suo saggio, sarebbe circa l’enfasi posta su alcuni punti, ad esempio, la disparità di dimensioni fisiche tra le stelle e gli uomini.

Tornerò su questo argomento.

La sua filosofia dei valore consiste nel dire che le uniche domande sul valore erano ciò che gli uomini desiderano e come i loro desideri potessero essere soddisfatti, e poi ha continuato ad andare avanti a rispondere a queste domande. Così l’ intero argomento divenne parte della psicologia, e la discussione sarebbe stata una discussione psicologica.

Naturalmente la sua principale presa di posizione sul valore potrebbe essere contestata, ma la maggior parte di noi sarebbe d’accordo che l’oggettività del bene sarebbe una cosa che avremmo deciso e respinto come l’esistenza di Dio .

La teologia e l’etica assoluta sono due temi famosi che abbiamo compreso non disporre di  oggetti reali.

L’etica è stata quindi ridotta a psicologia, e questo mi porta alla psicologia come soggetto di discussione. La maggior parte dei nostri incontri si potrebbe dire che hanno a che fare con questioni psicologiche. Si tratta di un argomento in cui siamo tutti più o meno interessati per ragioni pratiche. Nel considerare che dobbiamo distinguere la psicologia vera e propria che è lo studio di eventi mentali con lo scopo di stabilire generalizzazioni scientifiche, dalla semplice comparazione tra la nostra esperienza e l’interesse personale. La prova è se volessimo conoscere di questa esperienza quanto ci sarebbe di strano se noi la facciamo quando appartiene ad un nostro amico; se siamo interessati in essa come materiale scientifico, o semplicemente per curiosità personale .

Credo che raramente, se mai discutiamo questioni psicologiche fondamentali, ma molto più spesso semplicemente confrontiamo le nostre diverse esperienze, che non è una forma di discussione. Penso che ci rendiamo conto troppo poco quanto spesso i nostri argomenti sono della forma A ” Sono andato a Grantchester questo pomeriggio ” B ” No non l’ho fatto”. Un’altra cosa che facciamo spesso è quello di discutere per quale tipo di persone o comportamenti proviamo ammirazione, o proviamo vergogna. Ad esempio quando si discute la costanza di affetto esso consiste in A dicendo che si sentirebbe in colpa se non fosse costante, mentre in B dicendo che  lui non si sentirebbe colpevole affatto.

A parte questo, sebbene un modo piacevole di passare il tempo non sia di discutere nulla, ma semplicemente di confrontare gli appunti .

La Vera Psicologia d’altra parte è una scienza di cui la maggior parte di noi sa troppo poco per iniziare da arrischiare un parere.

Infine vi è l’estetica, tra cui la letteratura. Questa ci emoziona sempre molto di più di qualsiasi altra cosa, ma in realtà non ne discutiamo molto. I nostri argomenti sono così deboli; siamo ancora nella fase di “Chi spinge buoi grassi deve essere egli stesso grasso” e hanno ben poco da dire sui problemi psicologici in cui l’estetica in realtà consiste, ad esempio perché alcune combinazioni di colori ci danno tali sensazioni particolari. Quello che ci piace fare è di nuovo il confrontare la nostra esperienza; una pratica che in questo caso è particolarmente utile perché il critico può indicare cose ad altre persone, per cui se prestano attenzione, otterranno sentimenti che hanno valore, che non riuscirebbero ad ottenere altrimenti. Noi non discutiamo e non possiamo discutere se un’opera d’arte è migliore di un altra, ci limitiamo a confrontare le sensazioni che ci dà.

Concludo che non c’è davvero nulla da discutere, e questa conclusione corrisponde a una sensazione che ho anche circa una conversazione eccezionale. Si tratta di un fenomeno relativamente nuovo, originato da due cause che hanno operato gradualmente attraverso il 19° secolo. Una è il progresso della scienza, l’altro il decadere della religione, che hanno portato tutte le vecchie questioni principali a diventare o tecniche o ridicole. Questo processo di sviluppo della civiltà dobbiamo ciascuno di noi ripetere in noi stessi. Io per esempio, ho avvicinato  un novellino, che godeva della conversazione con argomentare più di ogni altra cosa al mondo, ma io ho iniziato gradualmente a considerarlo come di scarsa importanza perché non sembrava mai aver nulla da dire eccetto gli acquisti e la vita privata delle persone nessuna delle quali cose è adatta ad una conversazione su questioni generali. Anche dal momento che venivo analizzato sentivo che le persone sappiano molto meno su se stesse di quanto immaginano, e non sono poi così ansioso di parlare di me come ho fatto da concludere di aver avuto abbastanza di quel tipo fino ad annoiarmi. Ci sono ancora letteratura e l’arte, ma di loro non si può discutere si può confrontare solo gli appunti, proprio come si può scambiare informazioni sulla storia o sull’economia.

Ma sull’arte ci si scambia non informazioni, ma sentimenti.

Questo mi riporta a Russell e ” Che cosa credo?  . Se dovessi scrivere un Weltanschauung dovrei chiamarlo non “Quello che io credo”, ma ”Quello che sento”. Questo è collegato con il punto di vista di Wittgenstein che la filosofia non ci dà convinzioni, ma solo allevia i sentimenti di disagio intellettuale. Anche se dovessi litigare con l’articolo di Russell, non sarebbe su quello che egli credeva, ma sulle indicazioni che ha dato come quello che sentiva. Non che si può davvero litigare con i sentimenti di un uomo, si possono avere solo sentimenti propri differenti, e forse anche considerare i propri come più ammirevole o più favorevoli per una vita felice.

Da questo punto di vista che questa è una questione non di fatto, ma di sentimento. concludo alcune osservazioni sulle cose in generale, o come preferisco dire, non sulle cose, ma sulla vita in generale.

Dove mi sembra di essere diverso dalla maggior parte mia fratelli è nell’attribuire poca importanza alla dimensione fisica. Non mi sento meno umile di fronte alla vastità dei cieli.  Le stelle possono essere grandi, ma non possono pensare o amare, e quelle sono qualità che mi impressionano molto di più di quello che fanno le dimensioni. Non attribuisco nessuna importanza a me stesso per pesare quasi 238 libbre.

La mia immagine del mondo è disegnata in prospettiva, e non come un modello in scala. Il primo piano è occupato da esseri umani e le stelle sono così piccole come una monetina da tre penny. Io non credo veramente nell’astronomia, se non come una descrizione complessa di una parte del corso delle sensazioni umane e forse animali.

Applico il mio punto di vista non solo allo spazio, ma anche al tempo. Nel momento in cui il mondo si raffredderà e tutto morirà, ma c’è ancora un gran bel po’ di tempo, e il suo valore attuale a interesse composto è quasi nullo. Né il presente è meno prezioso perché il futuro sarà vuoto. Trovo l’umanità che riempie il primo piano della mia immagine interessante e del tutto ammirevole. Trovo, proprio ora almeno, il mondo un posto piacevole ed emozionante. Tu potresti trovarlo deprimente; mi dispiace per te, e tu mi disprezzeresti.

Ma io ho ragione e tu non ne hai; avresti solo una ragione per disprezzarmi se il tuo sentimento corrispondesse alla realtà a in cui il mio sentimento non corrisponde. Ma nessuno dei due può trovare una corrispondenza con la realtà.

Il fatto non è di per sé buono o cattivo; è solo che emoziona me, ma deprime te. D’altra parte ho pietà di voi con ragione, perché è più piacevole essere entusiasta che essere depresso, e non solo più piacevole ma meglio per tutte le attività di una persona.

Questo è il testo in lingua originale:

ON THERE BEING NO DISCUSSABLE SUBJECT 1

1 This paper has also been published under the title «Epilogue» in FM, pp. 287-292 and reprinted in PP, pp. 245-250. The present transcription is closer to the original.

28 Feb. 1925

Having to write a paper for the Society I was as usual at a loss for a subject; and I flattered myself that this was not merely my personal deficiency, but arose from the fact that there really was no subject suitable for discussion. But happening to have recently lectured on the Theory of Types I reflected that in such a sentence the word “subject” must be limited to mean “subject” of the first order and that perhaps there might be a subject of the second order which would be possible. And then I saw that it lay ready before me, namely that I should put forward the thesis that there is no discussable subject (of the 1st order).

A serious matter this if it is true. For for what does the society exist but discussion? and if there is nothing to discuss, but that can be left till afterwards.

I do not wish to maintain that there never has been anything to discuss but only that there is no longer; that we have really settled everything, by realising thats there is nothing to know except science. And that we are most of us ignorant of most sciences so that while we can exchange information we cannot usefully discuss them, as we are just learners.

Let us review the possible subjects of discussion. They fall so far as I can see under the heads of science, philosophy, history and politics, psychology and aesthetics; where, not to beg any question, I am separating psychology from the other sciences.

Science, history and politics are not suited for discussion except by experts. Others are simply in the position of requiring more information, and till they have acquired all available information, cannot do anything but accept on authority the opinions of those better qualified.

Then there is philosophy; this too has become too technical for the layman. Besides this disadvantage, the conclusion of the greatest modern philosopher is that there is no such subject as philosophy; that it is an activity not a doctrine, and that instead of answering questions, it aims merely at curing headaches. It might be thought that apart from this technical philosophy whose centre is logic, there was a sort of popular philosophy which dealt with such topics as the relation of man to nature, and the meaning of morality. But any attempt to treat such topics seriously reduces them to questions either of science or of technical philosophy, or results more immediately in perceiving them to be nonsensical.

Take as an example our brother Russell’s recent phenomenal lecture on what he believed. He divided it into two parts, the philosophy of nature and the philosophy of value. His philosophy of nature consisted mainly of the conclusions of modern physics, physiology and astronomy, with a slight admixture of his own theory of material objects as a particular kind of logical construction. Its content could therefore only be discussed by someone with an adequate knowledge of relativity, atomic theory, physiology and mathematical logic. The only remaining possibility of discussion in connection with this part of his paper, would be about the emphasis he laid on certain points, for instance the disparity in physical size between stars and men.

To this topic I shall return.

His philosophy of value consisted in saying that the only questions about value were what men desired and how their desires could be satisfied, and then he went on to answer these questions. Thus the whole subject became part of psychology, and the discussion would be a psychological one.

Of course his main statement about value might be disputed, but most of us would agree that the objectivity of good was a thing we had settled and dismissed like the existence of God.

Theology and Absolute Ethics are two famous subjects which we have realised to have no real objects.

Ethics has then been reduced to psychology, and that brings me to psychology as a subject for discussion. Most of our meetings might be said to deal with psychological questions. It is a subject in which we are all more or less interested for practical reasons. In considering it we must distinguish psychology proper which is the study of mental events with a view to establishing scientific generalisations, from merely comparing our experience from personal interest. The test is whether we should want to know of this experience as much if it were a stranger’s as we do when it is our friends; whether we are interested in it as scientific material, or merely from personal curiosity.

I think we rarely if ever discuss fundamental psychological questions, but far more often simply compare our several experiences, which is not a form of discussing. I think we realise too little how often our arguments are of the form A “I went to Grantchester this afternoon” B “No I didn’t”. Another thing we often do is to discuss what sort of people or behaviour we feel admiration for, or ashamed of. E.g. when we discuss constancy of affection it consists in A saying he would feel guilty if he weren’t constant, B saying be wouldn’t feel guilty in the least.

But that, although a pleasant way of passing the time is not discussing anything whatever, but simply comparing notes.

Genuine Psychology on the other hand is a science of which we most of us know far too little for it to become us to venture an opinion.

Lastly there is aesthetics, including literature. This always excites us far more than anything else; but we don’t really discuss it much. Our arguments are so feeble; we are still at the stage of “Who drives fat oxen must himself be fat” and have very little to say about the psychological problems of which aesthetics really consists, e.g. why certain combinations of colours give us such peculiar feelings. What we really like doing is again to compare our experience; a practice which in this case is peculiarly profitable because the critic can point out things to other people, to which if they attend, they will obtain feelings which they value which they failed to obtain otherwise. We do not and cannot discuss whether one work of art is better than another, we merely compare the feelings it gives us.

I conclude that there really is nothing to discuss, and this conclusion corresponds to a feeling I have about phenomenal conversation also. It is a relatively new phenomenon, which has arisen from two causes which have operated gradually through the 19th century. One is the advance of science, the other the decay of religion, which have resulted in all the old general questions becoming either technical or ridiculous. This process in the development of civilisation we have each of us to repeat in ourselves. I for instance came up as a freshman, enjoying conversation and argument more than anything else in the world but I have gradually come to regard it as of less and less importance because there never seems to be anything to talk about except shop and people’s private lives, neither of which is suited for general conversation. Also since I was analysed I feel that people know far less about themselves than they imagine, and am not nearly so anxious to talk about myself as I used to be having had enough of it to get bored. There still are literature and art, but about them one cannot argue one can only compare notes, just as one can exchange information about history or economics.

But about art one exchanges not information but feelings.

This brings me back to Russell and “What I believe?”. If I was to write a Weltanschauung I should call it not ‘‘What I believe” but ‘‘What I feel”. This is connected with Wittgenstein’s view that philosophy does not give us beliefs, but merely relieves feelings of intellectual discomfort. Also if I were to quarrel with Russell’s paper, it would not be with what he believed but with the indications it gave as to what he felt. Not that one can really quarrel with a man’s feelings, one can only have different feelings oneself, and perhaps also regard one’s own as more admirable or more conducive to a happy life.

From this point of view that it is a matter not of fact but of feeling I shall conclude by some remarks on things in general, or as I would rather say, not things, but life in general.

Where I seem to differ from most my brethren is in attaching little importance to physical size. I don’t feel the least humble before the vastness of the heavens. The stars may be large but they cannot think or love, and those are qualities which impress me far more than size does. I take no credit to myself for weighing nearly 17 stone.

My picture of the world is drawn in perspective, and not like a model to scale. The foreground is occupied by human beings and the stars are all as small as threepenny bits. I don’t really believe in astronomy, except as a complicated description of part of the course of human and possibly animal sensations.

I apply my perspective not merely to space but also to time. In time the world will cool and everything will die, but that is a long time off still, and its present value at compound discount is almost nothing. Nor is the present less valuable because the future will be blank. Humanity which fills the foreground of my picture I find interesting and on the whole admirable. I find, just now at least, the world a pleasant and exciting place. You may find it depressing; I am sorry for you, and you despise me.

But I have reason and you have none; you would only have a reason for despising me if your feeling corresponded to the fact in a way mine didn’t. But neither can correspond to the fact.

The fact is not in itself good or bad; it is just that it thrills me but depresses you. On the other hand I pity you with reason because it is pleasanter to be thrilled than to be depressed, and not merely pleasanter but better for all one’s activities.