Tag Archives: frank Ramsey

The Foundation of Mathematics di Frank Ramsey – Capitolo IX Last papers – Sezione D. La Conoscenza

28 Giu

Salaria in invernoRiporto la mia traduzione della sezione D. del capitolo IX  del libro The Foundation of Mathematics di Frank Plumpton Ramsey pubblicato a cura di R.B. Braithwaite. La sezione C. è stata già inserita nell’ambito dei capitoli e sezioni riguardanti la probabilità.

 

 

IX LAST PAPERS
D. LA CONOSCENZA

Ho sempre detto che una convinzione era la conoscenza se essa fosse (i) vera, ( ii ) certa, ( iii) ottenuta con un processo affidabile. Ma la parola ‘processo’ è molto insoddisfacente; possiamo chiamare inferenza un processo, ma anche allora inaffidabile sembra riferirsi solo a un metodo fallace non a una falsa premessa, come si si supporrebbe che sia. Possiamo dire che un ricordo è ottenuto mediante un processo affidabile? Penso che forse lo possiamo se intendiamo che il processo causale colleghi quello che è avvenuto con il mio ricordarlo. Potremmo allora dire, una convinzione ottenuta da un processo affidabile deve essere determinata da quelle che non sono convinzioni in una certa maniera o con l’accompagnamento che potrebbe essere più o meno affidabile nel fornire convinzioni vere, e se in questa serie di causalità si presentano altre convinzioni intermedie queste devono essere solo quelle vere.

Ad esempio ‘ La telepatia è conoscenza? ‘ Può significare : ( a) Assumendo che ivi ci sia un tale processo, si può confidare su di esso per creare convinzioni vere nel fare telepatia (entro alcuni limiti, per esempio quando ciò che si crede riguarda i pensieri del telepatico) ? o ( b) supponendo che siamo agnostici, la sensazione di essere telepatizzati garantirebbe la verità ? Idem per l’intuito femminile, le impressioni del carattere, ecc.

Forse dovremmo dire che ( iii) non è ottenuta con un processo affidabile, ma (iii) è formata in modo affidabile .

Diciamo ‘ io so ‘, però, ogni volta che siamo certi, senza riflettere sull’affidabilità. Ma se avessimo riflettuto allora dovremmo restarne certi se, e solo se, abbiamo pensato il nostro metodo affidabile.

(Supponendo che lo conosciamo; in caso contrario, assumendolo solo come descritto sarebbe lo stesso, ad esempio, Dio l’ha messo nella mia mente: Un processo apparentemente affidabile.) Perché pensare il metodo affidabile è semplicemente quello di formulare in una variabile ipotetica l’abitudine di seguire la procedura.

Una cosa ancora. Russell dice nei suoi Problems of Philosophy che non vi è alcun dubbio che a volte ci sbagliamo, così che tutta la nostra conoscenza è infettata da un certo grado di dubbio.

Moore è abituato a negare questo, dicendo ovviamente che era auto-contraddittoria, che è mera pedanteria e ignoranza di quale tipo di conoscenza intendiamo.

Ma sostanzialmente il punto è questo: non possiamo senza auto- contraddizione dire p  e  q e  r  e . . . e uno di p , q , r . . . è falso. (NB – Noi sappiamo quello che sappiamo, altrimenti non ci sarebbe contraddizione) . Ma possiamo essere quasi certi che una è falsa e tuttavia quasi certi di ciascuna di queste; ma p , q , r sono allora infettate dal dubbio. Ma Moore ha ragione nel dire che non necessariamente tutte sono così infettate; ma se ne escludiamo alcune, ci risulterà abbastanza evidente che uno degli esclusi è probabilmente sbagliato, e così via.

The Foundation of Mathematics di Frank Ramsey – Capitolo IX Last papers – Sezione B General Proposition and Causality

24 Giu

foto0003Riporto di seguito la mia traduzione della parte B del capitolo IX di The Foundation of Mathematics di Frank Plumpton Ramsey pubblicato a cura di R.B. Braithwaite.

Si tratta di una riflessione importante che riguarda la causalità e il modo di interpretarla nelle leggi scientifiche. Questi appunti non possono prescindere da tutta la trattazione del capito VII su verità e probabilità.

La lezione di Ramsey è fondamentale per la comprensione e l’uso dei metodi scientifici che sono dimostrati come mezzi di ragionamento utile, ma certamente non sono certamente verità di fede.

IX

LAST PAPERS

B. PROPOSIZIONI GENERALI E CAUSALITA’

Consideriamo il significato delle proposizioni generali in un determinato ben definito mondo. (In particolare, nel comune significato nel mondo materiale). Ciò comprende il comune problema della causalità.

Come tutti tranne noi 1 hanno sempre detto queste proposizioni sono di due tipi. La prima congiunzioni: ad esempio ‘Tutti in Cambridge hanno votato’; la variabile qui è, naturalmente, non le persone in Cambridge, ma una regione limitata di spazio che varia a seconda della determinatezza della idea di chi parla di ‘Cambridge’, che è ‘questa città’ o ‘la città in Inghilterra chiamato Cambridge ‘o qualsiasi essa sia.

1[Penso che questo si riferisca a lui ed a me stesso. – Il curatore]

I logici vecchio stile avevano ragione nel dire che si tratta di congiunzioni, in errore nella loro analisi di quali congiunzioni si trattasse. Ma, di nuovo nel giusto nel distinguerle radicalmente dall’altro tipo che possiamo chiamare variabili ipotetiche: ad esempio, L’arsenico è velenoso: Tutti gli uomini sono mortali.

Perché queste non sono congiunzioni?

Mettiamola prima in questo modo: Che cosa hanno in comune con le congiunzioni, e in che cosa si differenziano da loro?

Approssimativamente possiamo dire che quando le osserviamo soggettivamente si differenziano del tutto, ma quando le osserviamo oggettivamente, cioè per le condizioni della loro verità e falsità, sembrano essere la stessa cosa.

(x) .φx differisce da una congiunzione perché

  1. non può essere scritta per esteso come un unica cosa
  2. la sua costituzione come una congiunzione non viene mai utilizzata; non la usiamo mai nella classe del pensare, tranne nella sua applicazione ad una classe finita, cioè usiamo solo la regola applicativa.
  3. [Questa è la stessa (b) in un altro modo.] Essa va sempre oltre ciò che sappiamo o vogliamo; cfr. Mill in ‘Tutti gli uomini sono mortali’ e ‘Il duca di Wellington è mortale’. Esprime una deduzione che siamo in qualsiasi momento pronti a fare, non una convinzione del genere primario.

Una convinzione del genere primario è una mappa dello spazio contiguo secondo cui noi operiamo. Rimane una tale mappa per quanto la complichiamo o riempiamo di dettagli. Ma se apertamente l’estendiamo all’infinito, non è più una mappa; non possiamo assumerla o operare con essa. Il nostro viaggio è finito prima di aver bisogno delle sue parti più remote.

(d) Il pertinente grado di certezza è la certezza del caso particolare, o di un insieme finito di casi particolari; non di un numero infinito che non usiamo mai, e di cui noi non potremmo esserne certi affatto.

(x). φx assomiglia a una congiunzione

(a) In questo essa contiene tutte le meno importanti, vale a dire qui tutte quelle finite, congiunzioni, e appare come una sorta di prodotto infinito.

(b) Quando ci chiediamo che cosa la renderebbe vera, inevitabilmente rispondiamo che è vera se e solo se per ogni x abbiamo una φ; cioè quando noi la consideriamo come una proposizione capace delle due possibilità verità e falsità, siamo costretti a renderla una congiunzione, e siamo costretti ad avere una teoria delle congiunzioni che non possiamo esprimere per mancanza di capacità simbolica.

[Ma ciò non possiamo dire che non lo possiamo dire, e non lo possiamo neppure fischiare.]

Se allora non è una congiunzione, non è una proposizione per nulla affatto; allora sorge la domanda in che modo può essere giusta o sbagliata.

Ora, nel caso di una proposizione vero ed errato, ovvero vero o falso, si verificano due volte. Esse si verificano per l’uomo che costruisce la proposizione ogni volta che realizza una funzione verità di essa, cioè sostiene disgiuntamente i casi della sua verità e falsità.

Ora non facciamo mai questo con queste variabili ipotetiche tranne che in matematica in cui questo è ora riconosciuto come fallace. Potrebbe sembrare di farlo ogni volta che discutiamo le diverse teorie ottenibili combinando diverse proposte legge naturali. Ma qui, se P è una tale legge, non consideriamo l’alternativa P, cioè (x). φx, e   Schermata 2014-03-17 alle 19.05.23        , ossia Schermata 2014-03-17 alle 19.05.36 , ma riteniamo o di avere P o non avere P (dove non averla come una legge in nessun modo implica la falsità della legge, vale a dire

Schermata 2014-03-17 alle 19.05.46, oppure avendo Schermata 2014-03-17 alle 19.05.52 o avendo Schermata 2014-03-17 alle 19.06.00

L’altro modo in cui si verifica giusto e sbagliato in rapporto alle proposizioni è quello di uno spettatore che dice che la convinzione di un uomo nella proposizione è giusta o sbagliata. Questo, naturalmente, è motivato semplicemente da ciò che lo spettatore stesso pensa e risulta dall’identità o dalla differenza tra il suo punto di vista e quello che assume essere quello di un uomo che egli sta criticando. Se A pensa p e pensa che anche B pensa p, dice che B pensa correttamente;, se pensa p e pensa che B pensa Schermata 2013-11-24 alle 21.04.13, lui dice che B pensa erroneamente . Ma la critica non può essere sempre di questo tipo semplice; ma è possibile anche quando B pensa p, e A non  pensa né p né Schermata 2013-11-24 alle 21.04.13 , ma considera la questione non definita. Egli può ritenere B uno sciocco per pensare p, senza che egli stesso pensi Schermata 2013-11-24 alle 21.04.13     . Questo accade quasi sempre con le relazioni ipotetiche. Se B dice: ‘ Se mangio questa tortina avrò un mal di pancia ‘ , e A dice: ‘ No , non l’avrai ‘ , egli non sta effettivamente contraddicendo la proposizione di B, almeno se questa viene assunta come una implicazione materiale . Né sta contraddicendo una presunta affermazione di B è che la prova dimostra che è così e così. B non può fare tale affermazione, in realtà non sempre può ragionevolmente anche se è nel giusto . Perché egli può essere nel giusto, senza avere prove dalla sua parte.

In realtà è possibile l’ accordo e di disaccordo per quanto riguarda qualsiasi aspetto del punto di vista di un uomo e necessita che non assuma la forma semplice di ‘ p ‘ , ‘  Schermata 2013-11-24 alle 21.04.13   ‘ . Molte frasi esprimono atteggiamenti cognitivi senza essere proposizioni; e la differenza tra il dire sì o no a queste non è la differenza tra il dire sì o no a una proposizione. Questo è anche vero per l’ipotetica ordinaria [ come si può vedere dall’esempio precedente, essa afferma qualcosa per il caso in cui la sua protasi è vera: noi applichiamo la Legge del Terzo Escluso, non a tutto l’insieme, ma solo alla conseguenza]; e molto più della variabile ipotetica.

Al fine quindi di capire la variabile ipotetica e il suo giusto o sbagliato, dobbiamo considerare i diversi atteggiamenti possibili per essa; se sappiamo che cosa sono e che cosa queste coinvolgono possiamo procedere facilmente a spiegare il significato di dire che un tale atteggiamento è giusto o sbagliato, perché questo è semplicemente avere noi stessi un simile atteggiamento e pensare che uno dei nostri vicini ha lo stesso o un atteggiamento diverso.

Quali sono allora i possibili atteggiamenti alla domanda – sono tutti uomini mortali ?

( 1 ) Crederci con più o meno convinzione.

( 2 ) Non doverla prendere in considerazione.

( 3) Non crederlo perché non è provata .

( 4) Non crederlo, perché convinti che un certo tipo di uomo, che potrebbe esistere, sarebbe immortale.

( 5 ) Non crederlo in quanto convinti che un uomo particolare, è immortale .

Dobbiamo analizzare questi atteggiamenti; ovviamente in prima istanza l’analisi deve essere in termini di convinzioni nelle singole proposizioni, e tale analisi sarà sufficiente per il nostro attuale scopo.

Credere che tutti gli uomini sono mortali – che cos’è? In parte il dire così, in parte credere in merito a qualsiasi x che si trova che se lui è un uomo che è mortale. La convinzione generale consiste in

( a) Un enunciato generale ,

( b) L’abitudine di convinzione singolare .

Questi sono, ovviamente, collegati, l’abitudine derivante dalla enunciazione secondo una legge psicologica che determina il significato di ‘ tutti’ .

Noi così spieghiamo

( 1 ) Per quanto riguarda la nozione di ‘ abitudine ‘ ;

( 2 ) Che non offre nessun problema ;

( 3 ) Può sembrare che determini un problema se ci chiediamo – Che cosa è che il pensatore ritiene ? Ma non c’è davvero nessun problema: questo non è il valutare se una cosa è così o no, né ancora il valutare se fare o non fare qualcosa, ma una sorta di cosa intermedia. Nasce l’ idea di una affermazione generale, la prova viene valutata e di nuovo crolla.

In ( 4) e ( 5) crolla con maggiore precisione per i motivi indicati: vale a dire, in ( 4) abbiamo un’altra dichiarazione generale che, combinata con quella proposta darebbe una conclusione a cui siamo riluttanti (di per sé una terza affermazione generale, vale a dire ‘ Tutti gli uomini non sono di questo tipo’) e in ( 5 ) si ha una singolare dichiarazione che contraddice nettamente quella proposta.

Le variabili ipotetiche o leggi causali formano il sistema con il quale chi parla si rapporta con il futuro; non sono, quindi,soggettive, nel senso che se io e te ne enunciamo di differenti stiamo dicendo ciascuno qualcosa di noi stessi che passa dall’una all’altro come ‘ sono andato a Grantchester ‘ , ‘ non l’ho fatto . ‘ Perché se ci rapportiamo al futuro con diversi sistemi non siamo d’accordo anche se il futuro reale è d’accordo con entrambi a condizione che ciò possa (logicamente) concordare con uno ma non con l’altro, vale a dire così a condizione che noi non crediamo le stesse cose. ( Cf. Se A è certa , B dubbio, essi possono ancora disputarne.)

Le variabili ipotetiche non sono giudizi , ma regole per giudicare ‘ Se incontro un φ, io lo considerarlo come un ψ : ‘ . Questo non può essere negato ma può risultare in disaccordo con uno che non l’adotta.

Questi atteggiamenti sembrano quindi di coinvolgere un’idea enigmatica, tranne che per quella della consuetudine; chiaramente qualsiasi proposizione su una consuetudine è generale, e quindi la critica su un giudizio giudizio generale è di per sé un giudizio generale. Ma dal momento che ogni convinzione implica l’abitudine, così fa la critica di ogni giudizio quale che sia, e non vedo nulla di eccepibile in questo. Qui sussiste una sensazione di circolarità su di questo, ma penso che sia illusoria. Comunque dovremo tornarci più avanti.

Questa considerazione delle leggi causali ha una certa somiglianza con Braithwaite , 1 e dobbiamo confrontarla da vicino per vedere se sfugge alle obiezioni a cui la sua considerazione è soggetta. Egli ha detto che un universale di una legge era quello creduto su basi non dimostrative, e io ho detto 2 che non sarebbe così per tre distinte ragioni:

( a) Alcuni universali di leggi non vengono creduti affatto, ad esempio le  leggi causali sconosciute.

( b) Alcuni universali di fatti sono creduti per motivi non dimostrativi.

( c ) Alcuni universali (derivati ​​e localizzati) di leggi sono creduti su basi dimostrative.

Io , dunque , ho messo su una teoria diversa per cui le leggi causali sarebbero conseguenze di certe proposizioni che dovremmo assumere come assiomi se sapessimo tutto e dovremmo organizzarle nel modo più semplice possibile in un sistema deduttivo.

1 R.B. Braithwaite , “The Idea of Necessary Connexion,” Mind, 1927 and 1928.

2 [ In una nota della primavera del 1928 superato da questo articolo. -Ed .]

Ciò che viene detto sopra significa, naturalmente, un rifiuto completo di questo punto di vista (perché è impossibile sapere tutto e organizzarlo in un sistema deduttivo) e un ritorno a qualcosa di più vicino a Braithwaite. Una generalizzazione causale non è, come allora ho pensato, qualcosa che è semplice, ma qualcosa in cui crediamo (cfr. l’età alla morte dei cuochi poeti). Possiamo crederci perché è semplice, ma questo è un altro discorso. Quando dico questo non devo essere frainteso; le variabili ipotetiche non si distinguono dalle congiunzioni per il fatto che noi le crediamo, esse sono molto più radicalmente differenti. Ma essendo la prova di un essere una variabile ipotetica (spesso almeno) una congiunzione, una tale congiunzione si distingue dalle altre in questo che ci crediamo per guidarci in un caso nuovo, cioè deriva da essa una variabile ipotetica.

Questo spiega come Braithwaite è pervenuto a dire che le leggi sono quelle che vengono credute; ma, messo come dice lui, è ovviamente sbagliato, essendo aperto alle obiezioni formulate in precedenza.

Il problema di Braithwaite era quello di spiegare il significato di ‘ P è una legge di natura ‘ . La nostra soluzione è che dire questo, è l’affermare P alla maniera di una variabile ipotetica. [ O, naturalmente, possiamo estendere la legge della natura per qualsiasi congiunzione che segue da una nel senso di cui sopra.] Ma questa soluzione è incompleta perché non spiega affatto cosa intendiamo quando parliamo di una legge di natura sconosciuta, o di una legge descritta ma non formulata, ad esempio, la legge che le caratteristiche delle persone dipendono in qualche modo dai cromosomi (ma nessuno sa come), oppure, egli ha scoperto una legge che disciplina l’estensione delle molle (ma non so quale legge), dove in un secondo caso dico che egli ritiene una variabile ipotetica, e successivamente implica che è vera, ma dal momento che io non so cosa sia non posso anch’io adottare il suo atteggiamento verso di essa.

Così, in ognuno di questi casi ci sembra di trattare la legge sconosciuta come una vera proposizione in un modo che la nostra teoria dice che è impossibile.

La stessa difficoltà si verifica anche nella teoria finitista della matematica, quando si parla di una sconosciuta proposizione matematica vera. In questo campo più noto la soluzione dovrebbe essere più semplice e quindi estensibile all’altro campo.

Una verità sconosciuta nella teoria dei numeri non può essere interpretata come una (sconosciuta) proposizione vera per tutti i numeri, ma come una proposizione dimostrata o dimostrabile. Dimostrabile a sua volta significa dimostrabile in qualsiasi numero di passi, e coi principi finitisti il numero di passi deve in qualche modo essere limitato, ad esempio, all’umanamente possibile. ‘Così e così ha scoperto un nuovo teorema ‘ significa quindi che egli ha costruito una prova di una certa dimensione limitata.

Quando passiamo a una legge causale sconosciuta, cosa c’è che corrisponde al processo di prova a cui conduce la soluzione sopra descritta? Chiaramente solo il processo di raccogliere le prove per la legge di causalità, e il dire che c’è una legge del genere, anche se non la conosciamo, deve significare che ci sono certi fatti singolari in una qualche sfera limitata (una disgiunzione ) che ci porterebbero, avendoli conosciuti, ad affermare una variabile ipotetica. Ma questo non è sufficiente, perché non ci devono essere semplicemente fatti che portano alla generalizzazione, ma quando realizzato non ci deve trarre in inganno. ( O non potremmo chiamarla una vera legge causale.) Occorre pertanto anche essere affermato che occupi una determinata limitata area in misura pari alla portata della nostra esperienza possibile.

Non ci sarebbe niente che corrisponda a questo, nel caso matematica, perché una generalizzazione matematica deve se dimostrata appartenere a qualsiasi caso particolare, ma una generalizzazione empirica non può essere provata; e perché l’esserci la prova che conduce ad essa e perché essa si presenta in altri casi sono anche fatti distinti.

A questa considerazione ci sono due possibili obiezioni nel punto a favore del circolo vizioso. Stiamo cercando di spiegare il significato di affermare l’esistenza di una legge causale sconosciuta, e la nostra spiegazione può essere detta in termini dell’asserzione di certe leggi, e questo in due modi diversi. Diciamo che significa che ci sono fatti che ci porterebbero ad affermare una variabile ipotetica; e qui può essere ammesso che questo significa che ci condurrebbero in virtù di una legge causale forse sconosciuta a formarci un’abitudine che sarebbe costituita da un’altra legge causale.

A questo noi rispondiamo, in primo luogo, che la legge causale che in virtù della quale i fatti ci porterebbero alla generalizzazione non deve essere un qualche legge sconosciuta, ad esempio una per cui la conoscenza dei fatti prima ci condurrebbe alla pazzia così alla generalizzazione della pazzia, ma per cui le leggi conosciute esprimano i nostri metodi di ragionamento induttivo; e, in secondo luogo, che l’ignota variabile ipotetica deve essere qui assunta a significare una asserzione non nota (la cui sintassi sarà ovviamente conosciuta, ma non i suoi termini e il loro significato), il che, naturalmente , porterebbe ad una abitudine in virtù di una legge psicologica nota.

Ciò che abbiamo detto è, credo, un profilo sufficiente delle risposte ai problemi rilevanti di analisi , ma è idoneo a lasciarci confusi e insoddisfatti da quello che sembra il problema principale – una questione non di analisi psicologica, ma di metafisica che è ‘ La causalità è una realtà o una finzione, e, se una finzione, è utile o fuorviante, arbitraria o indispensabile ? ‘

Possiamo cominciare a chiedersi se queste variabili ipotetiche svolgono un ruolo essenziale nel nostro pensiero; potremmo, per esempio, pensare che possano essere semplicemente eliminate e sostituiti dalle proposizioni primarie che servono come prova per esse.

Questo è, credo, il punto di vista di Mill, il quale sosteneva che invece di dire ‘ Tutti gli uomini muoiono, quindi il duca di Wellington morirà ‘, potremmo dire ‘ – così e così gli uomini sono morti 1, quindi il Duca morirà’. Questo punto di vista può essere sostenuto osservando che lo scopo ultimo del pensiero è quello di guidare la nostra azione, e che in ogni occasione la nostra azione dipende solo da convinzioni o gradi di convinzione in singole proposizioni. E dal momento che sarebbe possibile organizzare le nostre singole convinzioni singole utilizzare variabili intermediarie, siamo tentati di concludere che esse sono puramente superflue.

1 Potremmo essere inclini a dire che la prova non è semplicemente che A , B , C sono morti , ma che A, B , C sono morti , e nessuno per quanto ne sappiamo, non è morto; vale a dire ‘ tutto quello che ne sappiamo è che sono morti ‘. Ma l’extra che non fa parte della prova, ma una descrizione di essa, è il dire: ‘ e queste sono tutte le prove ‘.

Ma questo, credo, potrebbe essere sbagliato; a prescindere dal loro valore nel semplificare il nostro pensiero, esse costituiscono una parte essenziale della nostra mente. Quello che noi pensiamo esplicitamente in termini generali è alla radice di ogni lode e di biasimo e molte discussioni. Non possiamo biasimare un uomo se non considerando cosa sarebbe successo se avesse agito diversamente, e questo tipo di condizionale incompleto non può essere interpretato come una implicazione materiale, ma dipende essenzialmente da variabili ipotetiche. Consideriamo questo più da vicino.

Quando deliberiamo su una possibile azione, ci domandiamo che cosa accadrà se facciamo questo o quello. Se diamo una risposta determinata nella forma ‘ Se faccio p, risulterà q, ‘ questo può essere correttamente considerato come una implicazione materiale o una disgiunzione se ‘ O non p e q . ‘ , Ma si differenzia, ovviamente, da qualsiasi ordinaria disgiunzione dal fatto che uno dei suoi membri, non è qualcosa di cui stiamo cercando di scoprire la verità, ma qualcosa in nostro potere da rendere vera o falsa.1 Se andiamo oltre a ‘ E se q , allora r’ , otteniamo più implicazioni materiali di tipo più ordinario.

Oltre a definite risposte ‘ Se p , risulterà q’, spesso otteniamo quelle ‘ Se p , risulterebbe q ‘ o ‘ risulterebbe probabilmente q ‘.

Qui il grado di probabilità non è chiaramente un grado di convinzione in ‘ Non p o q ‘ , ma un grado di convinzione in q dato p, che è evidentemente possibile avere senza una grado definito di convinzione in p, p non essendo un problema intellettuale. E il nostro comportamento è in gran parte determinato da questi gradi di convinzione ipotetica.

1 È possibile prendere l’azione volontaria di uno sul futuro come un problema intellettuale : ‘ Sarò in grado di mantenerlo? ‘ Ma solo dissociando il futuro stesso di quel tale.

Ora supponiamo che un uomo è in una situazione del genere. Ad esempio, supponiamo che abbia una torta e decida di non mangiarla, perché pensa che gli farà male allo stomaco, e supponiamo che osserviamo la sua condotta e decidiamo che si sbaglia. Ora la convinzione su cui quell’uomo agisce è che se mangia la torta si ammalerà, assunta secondo il nostro ragionamento di cui sopra come implicazione materiale.

Non possiamo contraddire questa affermazione sia prima sia dopo l’evento, perché è vera a condizione che l’uomo non mangi la torta, e prima dell’evento non abbiamo motivo di pensare che la mangerà, e dopo l’evento sappiamo che non l’ha mangiata.

Dal momento che non pensa nulla di falso, perché disputiamo con lui o lo condanniamo?

Prima dell’evento non siamo diversi da lui in modo abbastanza chiaro: non è che egli crede p, e noi    Schermata 2013-11-24 alle 21.04.13                  ; ma ha un diverso grado di convinzione in q dato p rispetto al nostro; e possiamo , ovviamente, cercare di convertirlo al nostro punto di vista 1 Ma dopo l’evento sappiamo entrambi che non ha mangiato la torta e che egli non si è ammalato; la differenza tra noi è che lui pensa che se l’avesse mangiata si sarebbe ammalato mentre noi pensiamo che non lo sarebbe. Ma questo non è, prima facie, una differenza di gradi di convinzione in qualche proposizione, perché siamo entrambi d’accordo su tutti i fatti .

1 Se due persone stanno discutendo : ‘Se p sarà q ? ‘ E sono entrambi in dubbio su p , stanno aggiungendo p ipoteticamente al loro bagaglio di conoscenze e discutendo su tale base su q; in modo che in un certo senso ‘ Se p , q e ‘ se p ,    Schermata 2013-08-23 alle 22.32.01                   ‘ sono contraddittorie . Possiamo dire che stanno fissando i loro gradi di convinzione in q dato p . Se p risulta falsa, questi gradi di convinzione sono resi nulli. Se una delle parti ritiene Schermata 2013-11-24 alle 21.04.13 certo. la questione cessa di significare qualcosa per lui se non come una questione su quanto segue da certe leggi o ipotesi .

Il significato di queste affermazioni circa le condizioni non soddisfatte, e il fatto che se le condizioni sono soddisfatte o no non fa alcuna differenza per la differenza tra noi, la base comune, come si potrebbe dire, della controversia sta nel fatto che noi pensiamo in termini generali. Abbiamo ognuno di noi variabili ipotetiche (o, in caso di incertezza, probabilità), che applichiamo a qualsiasi problema di questo genere; e la differenza tra noi è una differenza nei confronti di queste. Abbiamo gradi di aspettativa, vaghe o chiare, per l’esito di qualsiasi stato di cose quando o dove esso si verifichi. Dove qui sia suscettibile ad essere ambiguo è nella definizione dello stato di cose; per esempio, nel considerare cosa sarebbe successo se un uomo avesse agito diversamente, siamo portati a introdurre qualsiasi fatto che conosciamo, sia che l’abbia conosciuto o l’abbia potuto conoscere, ad esempio la posizione effettiva di tutte le carte di bridge rispetto alle loro probabilità di posizione dal suo punto di vista. Ma ciò che è chiaro è che le nostre aspettative sono generali; quando la sorte è chiaramente definita ci aspettiamo le stesse probabilità in ogni categoria del genere.

In caso contrario, e ci aspettavamo differentemente in ogni caso reale, l’attesa in un caso immaginario non potrebbe avere alcun significato .

Tutto questo si applica, naturalmente, altrettanto bene per le conseguenze di qualsiasi evento ipotetico e non solo alle azioni umane .

Ho scelto di esporre con riferimento a quest’ultimo, perché penso che sia di molto particolare importanza nello spiegare la posizione speciale posseduta dalle leggi causali, che sono un importante, ma non l’unico tipo di variabili ipotetiche. Per far fronte a questa domanda cominciamo con le ipotetiche in generale.

‘ Se p , allora q ‘ può in nessun modo essere vero a meno che l’implicazione materiale p ⊃ q sia vera; ma in genere significa che p ⊃ q non solo è vero, ma deducibile o rilevabile in qualche modo particolare non determinato1 esplicitamente.

1 ‘ se p , allora q ‘ può anche significare pr ⊃ q dove r non è un fatto o una legge, o non solo , composta di fatti o di leggi, ma anche composto da proposizioni in un sistema secondario. Ad esempio , da un punto di vista solipsistico , ‘ Se apro gli occhi vedrò rosso . ‘ Le teorie ipotetiche del mondo esterno di Mill sono di questa natura, e non possono essere utilizzate per definire il mondo esterno. Tutto quello che potrebbe essere utilizzato sono le leggi da cui, combinate con la mia esperienza passata, ne potrebbe seguire che se apro gli occhi vedrò rosso. Ma questo non potrebbe coprire congetture per il mondo esterno, a meno che non pensiamo che una sufficiente conoscenza della legge ci consentirebbe di rendere tutte queste congetture certe. Faccio la congettura di qualcosa; questa può essere solo ipotetica se l’ipotesi può fare riferimento a un sistema secondario.

Il punto di vista di Mill deve essere sostituito dicendo che il mondo esterno è un sistema secondario, e che qualsiasi proposizione su di esso impegna una persona a a non più giudizi che una negazione di tutti i corsi di esperienza in contrasto con esso.

Questo è sempre evidente quando ‘ se p , allora q ‘ o ‘ perché p , q ‘ (perché è solo una variante di se, quando p è noto essere vera ) è pensato correttamente specificando anche quando è già noto sia che p è falso sia che q è vero. In generale si può dire che con Mill ‘ Se p allora q ‘ significa  q si può inferire da p, cioè, ovviamente, da p insieme ad alcuni fatti e leggi non stabilite ma in qualche modo indicate dal contesto. Ciò significa che p ⊃ q segue da tali fatti e leggi, che se vero non è in alcun modo un fatto ipotetico; in modo che, nonostante il suono di ottenuto da inferenza, la spiegazione di Mill non è circolare come pensava Bradley. Naturalmente che p ⊃ q deriva dai fatti non è una proposizione di logica, ma una descrizione dei fatti : ‘ Essi sono tali da coinvolgere p ⊃ q. ‘ Corrispondendo al tipo di leggi o fatti intesi otteniamo diverse sottili variazioni sintattiche. Ad esempio , ‘ se lui fosse stato lì, dovrebbe aver votato per questo ( perché questo è stato approvato all’unanimità), ma se fosse stato lì, avrebbe votato contro di esso (essendo tale la sua natura ).’  [ In questo, legge = variabile ipotetica. ]

Una classe di casi è particolarmente importante , vale a dire quelli in cui, come si dice, il nostro ‘ se ‘ ci dà non solo una ratio cognoscendi ma anche una ratio essendi. In questo caso, che è ad esempio quello normale quando diciamo: ‘Se p doveva accadere, q sarebbe dovuto accadere ‘, p ⊃ q deve seguire da un ipotetica ( x ) . φx ⊃ ψx e fatti r , pr ⊃ q essendo un caso particolare di φx ⊃ ψx e descrivendo q gli eventi non prima di tutti quelli descritti in pr. Una variabile ipotetica di questo tipo noi chiamiamo una legge causale .

Ora dobbiamo spiegare l’importanza peculiare e l’obiettività attribuita alle leggi causali; come, per esempio, la deduzione di effetto da causa è concepito come così radicalmente diverso da quello di causa dall’effetto. (Nessuno direbbe che la causa esisteva a causa dell’effetto.) Ed è, a quanto pare, un fatto fondamentale che il futuro è dovuto al presente, o, più semplicemente, è influenzato dal presente, ma il passato non lo è.

Cosa significa questo? Non è chiaro e, se cerchiamo di chiarirlo, si trasforma in un nonsenso o una definizione: ‘ Parliamo di ratio essendi quando la protasi è precedente all’apodosi Df . ‘Sentiamo che questo è sbagliato; pensiamo che ci sia una certa differenza fra prima e dopo a cui stiamo arrivando a comprendere, ma cosa può essere? Ci sono differenze tra le leggi che derivino un effetto da una causa e quelli che derivino una causa da un effetto; ma possono davvero essere quello che intendiamo? No, perché si ricavano a posteriori, ma ciò che intendiamo è un a priori ‘ . [La seconda legge della termodinamica è a posteriori; ciò che è singolare è che questa sembra risultare dalla semplice assenza di una legge (vale a dire la probabilità), ma ci potrebbe essere una legge di mescolamento. ]

Quello che poi crediamo per il futuro che non lo crediamo il passato; il passato, pensiamo, è fissato, se questo significa qualcosa di più che è passato, potrebbe significare che, secondo noi è fissato, che nulla ormai potrebbe cambiare la nostra opinione al riguardo, che ogni evento presente non è pertinente alla probabilità per noi di qualsiasi evento passato. Ma questo è chiaramente falso. Ciò che è vero è questo, che l’eventuale attuale volizione nostra (per noi) non è pertinente ad un qualsiasi evento passato. Per un altro ( o per noi stessi in futuro) può servire come un segno del passato, ma quello che ora facciamo riguarda solo la probabilità del futuro.

Questa mi sembra la radice della questione; che non posso influenzare il passato, è un modo di dire qualcosa di abbastanza chiaramente vero per i miei gradi di convinzione. Inoltre dalla situazione in cui stiamo discutendo mi sembra sorgere la differenza generale di causa ed effetto. Siamo poi impegnati non sulla conoscenza imparziale o sulla classificazione (a cui questa differenza è del tutto estranea), ma a disegnare le diverse conseguenze delle nostre azioni possibili, che noi naturalmente facciamo in sequenza in avanti nel tempo, procedendo dalla causa all’effetto, non dall’effetto alla causa. Possiamo produrre A o A ‘ che produce B o B ‘, che , ecc . . . , Le probabilità di A , B sono interdipendenti, ma  giungiamo ad A dalla nostra presente volizione.

Diciamo che le persone possono influire solo sul futuro e non sul passato per due motivi; in primo luogo, per analogia con noi stessi che sappiamo che esse possono influenzare il futuro e non il passato dal loro punto di vista; e in secondo luogo, se includiamo la loro azione nella categoria generale di causa ed effetto, ciò solo può essere una causa di ciò che è successivo a questo. Ciò significa in ultima analisi che influendo su questo possiamo influire solo indirettamente (nel nostro calcolo), sugli gli eventi successivi ad esso. In un certo senso la mia azione attuale è una basilare e la sola basilare contingenza.

[ Naturalmente è il  nostro passato che conosciamo che non possiamo modificare; noi sappiamo che possiamo modificare il nostro futuro. La ramificazione di effetti con al massimo la velocità della luce è nota dall’esperienza. ]

È chiaro che il concetto e l’uso di leggi causali non presuppone alcuna ‘ legge di causalità ‘ di effetti nel senso che ogni evento ha una causa . Abbiamo alcune ipotetiche variabili della forma ‘ Se φx , allora ψx ‘ con ψ successivo a φ , chiamate leggi causali: altre nella forma ‘ Se φx allora la probabilità α per ψx ‘; questa è detta probabilità. Supponiamo la probabilità fondata se osserviamo che non c’è alcuna speranza di sostituirla con una legge se avessimo avuto conoscenza di sufficienti fatti. Non c’è ragione di supporre che non è fondata. Una legge ha una probabilità pari a 1; naturalmente, come è mostrato nel mio saggio sul caso, le probabilità non danno gradi reali di convinzione ma un più semplice sistema a cui quelle reali si approssimano. Così anche noi non diamo le leggi per certe.

Sul punto di vista che abbiamo spiegato, la necessità causale non è un fatto; quando affermiamo una legge causale stiamo affermando non un fatto, non una congiunzione infinita, né un collegamento di universali, ma una variabile ipotetica che non è per nulla strettamente una proposizione, ma una formula da cui deriviamo delle proposizioni .

La critica più evidente di questo punto di vista è che è un circolo vizioso, perché esso cerca di spiegare la causalità mediante un concetto, cioè quello di una variabile ipotetica, che implica causalità. Perché l’esistenza di una variabile ipotetica dipende dal nostro usarla come tale, cioè secondo una legge causale di nostra propria natura procedendo da questa a particolari convinzioni.

Dobbiamo cercare di dare la risposta a questa critica veramente chiara, perché è certamente infondata.

Un punto essenziale minore può essere determinato in primo luogo: le variabili ipotetiche implicano causalità, né più né meno delle convinzioni comuni; perché ciò appartiene all’essenza di ogni convinzione che deduciamo da ciò, e agisce su di essa in un certo modo; e questo concetto implica causalità proprio come fa la variabile ipotetica.

La legge causale collegata con quest’ultima è più complicata, ma non essenzialmente diversa. Ad esempio non esiste una gerarchia di tipi di leggi causali, ma semplicemente crescenti complicazioni omogenee come ( x ) . . , ( x ) ( y ) . . . , ( x ) ( y ) ( z ) . . .

Ma ora veniamo al punto principale. Il mondo , o meglio quella parte di esso di cui siamo a conoscenza, mostra come dobbiamo tutti essere d’accordo con una buona dose di regolarità di successione. Io sostengo in aggiunta che non presenta nessuna caratteristica denominata necessità causale, ma che costruiamo le frasi dette leggi causali da cui (cioè avendo costruito quelle con cui) si procede alle azioni e alle proposizioni connesse tra loro in un certo modo, e diciamo che un dato di fatto affermato in una proposizione che è un caso particolare di una legge causale è un caso di necessità causale. Questa è una caratteristica normale della nostro modo di fare, una parte della regolarità generale delle cose; come sempre non c’è nulla in questo oltre alla regolarità che sia chiamato causalità, ma possiamo ancora costruire una variabile ipotetica di questo nostro comportamento e parlarne come un esempio di causalità.

Ma non può esserci qualcosa che potrebbe essere chiamato reali connessioni di universali ? Non posso negarlo, perché io non posso comprendere nulla da tale frase; io trovo che quello che noi chiamiamo leggi causali non sono nulla di questo genere.

Così pure ci potrebbe esserci una totalità infinita, ma quello che mi sembrano essere proposizioni riguardo a ciò sono ancora variabili variabili e ‘ raccolta infinita ‘ è davvero un nonsenso.

Le variabili ipotetiche hanno analogie formali con altre proposizioni che ce le fanno assumere a volte come fatti circa universali, a volte come congiunzioni infinite. Le analogie sono fuorvianti , difficile tuttavia che siano da sfuggire, ed emotivamente soddisfacenti in quanto prove di diversi tipi di atteggiamenti mentali. Entrambe queste forme di ‘ realismo ‘ devono essere respinte dallo spirito realistico.

Il tipo di cosa che fa sentire il desiderio di assumere una visione realistica della causalità è questo. Supponiamo che la razza umana per nessun motivo sempre supponga che le fragole darebbero ad essa mal di pancia, e così non le mangia; allora tutte le sue convinzioni, così dette rigorosamente, ad esempio, che se mangio fragole avrò un dolore, sarebbero vere; ma non ci sarà davvero qualcosa di sbagliato ? Non è un fatto che se le avessero mangiate non avrebbero avuto un dolore?

No, non è questo un fatto; è una conseguenza della mia regola. Quello che è un fatto è che le ho mangiate e non ho avuto un dolore. Se abbiamo considerato il condizionale incompleto come un fatto dovremmo supporre che qualsiasi di tali asserzioni come ‘ Se avesse mischiato le carte , si sarebbe dato un asso ‘ ha un chiaro significato vero o falso, il che è assurdo. Noi lo consideriamo solo come sensato se essa, o la sua contraddittoria, può essere dedotta dal nostro sistema. Altrimenti diciamo ‘ Non si può dire cosa sarebbe successo ‘, che suona come una confessione di ignoranza, ed è così infatti , perché significa che non possiamo prevedere cosa accadrà in un caso simile, ma non perché ‘quello che sarebbe successo ‘ è una realtà di cui siamo ignoranti .

Ma il loro sistema, direte voi, si adatta a tutti i fatti loro noti; se due sistemi entrambi si adattano ai fatti, non è la scelta un capriccio?

Noi, tuttavia, riteniamo che il sistema è univocamente determinato e che una abbastanza lunga indagine ci porterà del tutto ad esso.

Questo è il concetto di Peirce di verità come quello che tutti crederanno alla fine; non si applica alla asserzione veritiera di elementi di fatto, ma al ‘ vero sistema scientifico ‘.

Cosa c’era di sbagliato con i nostri amici che si astenevano dalle fragole era che non lo sperimentavano. Perché si dovrebbe sperimentare ? Per aumentare il peso di una probabilità : se q è pertinente con p, è bene scoprire q prima di agire in un qualche modo che coinvolge p. Ma se q è noto, non vale la pena; sapevano, così hanno pensato, quale sarebbe stato il risultato dell’esperimento e così naturalmente non si sarebbero incomodati a farlo.

La difficoltà deriva fondamentalmente dall’assumere che ogni frase sia una proposizione: quando si vede considerando la posizione di coincidenze che le probabilità non sono proposizioni allora dovrebbe essere chiaro che le leggi non sono né l’uno né l’altro, a prescindere da altre ragioni .

NOTE

( 1 ) tutte le teorie , le probabilità e le leggi sono costruiti con l’obiettivo di integrazione attraverso la scoperta di ulteriori fatti; questi fatti sono sempre assunti come noti con certezza. Che cosa si deve fare quando non siamo certi di essi è rimasto abbastanza incerto, così come lo è il riconoscimento deve essere dato all’incertezza circa la teoria stessa.

( 2 ) Probabilità e legge sono utilizzati nello stesso modo in un sistema teoretico come in un sistema primario; a ragione, anche, se il sistema teoretico è temporale. Naturalmente il sistema teoretico è del tutto come una variabile ipotetica nell’essere ivi solo dedotta da; e una legge nel sistema teoretico è di secondo grado di deduzione.

( 3) Se le conseguenze di una legge o di una teoria non sono chiare, cioè se non vi è alcuna prova se una cosa può o non può essere dedotta da esse, allora deve essere assunta in modo formale; questa è un’abitudine non il credere ψ ogni volta che vediamo φ, ma di credere il significato di ogni simbolo dedotto da questi segni.

( 4) Qualcosa va detto della relazione di questa teoria con Hume. Hume ha detto che, come noi , che non c’è nulla, tranne la regolarità, ma sembrava contraddire se stesso nel parlare di determinazione nella mente e di una sensazione di determinazione che fornirebbe l’idea di necessità. Siamo accusati della stessa circolarità ingiustamente: egli si è messo in un pasticcio prendendo un ‘idea ‘ di necessità e cercandone una di’ impressione ‘. Non mi è chiaro che ci sia una tale idea e una tale impressione, ma ci potrebbero essere.

Quando siamo obbligati a seguito di un’esperienza a pensare in un modo particolare, noi probabilmente abbiamo una sensazione diversa da quando prendiamo una decisione di fresco. Ma non dobbiamo dire che ci sentiamo di essere obbligati, perché nella mente c’è solo la regolarità: la necessità è come sempre una figura retorica. Penso che abbia capito molto bene , e abbia dato ai suoi lettori credito di più intelligenza di quanto essi mostrano nelle loro interpretazioni letterali.

( 5 ) Come opposto ad una teoria puramente descrittiva della scienza, la mia può essere chiamata teoria previsionale. Il considerare una legge come una sintesi di alcuni fatti mi sembra insufficiente; essa è anche un atteggiamento di aspettativa per il futuro. La differenza è più evidente per quanto riguarda le probabilità; i fatti riassunti non escludono le stesse possibilità di una coincidenza che sarebbe riassumibile e che, infatti, comporterebbe una teoria del tutto diversa .

Frank Ramsey: FURTHER CONSIDERATIONS – Capitolo VIII di The Foundation of Mathematics e Parte C. di Last Papers

22 Giu

Ramsey_2Propongo la mia traduzione delle parti del testo di Frank Plumpton Ramsey aggiuntive all’esame dei sistemi di valutazione delle probabilità. Si tratta del capitolo VIII di The Foundation of Mathematics e la sezione C. del capitolo IX ‘Last Papers’.

Si tratta di una serie di elementi aggiuntivi e correttivi della teoria esposta nel capitlo VII.

VIII

ULTERIORI CONSIDERAZIONI (1928)

A. RAGIONEVOLE GRADO DI CONVINZIONE

Quando passiamo oltre ragionevole = mio, o = scientifico, il definirlo in modo esatto è proprio impossibile. Seguendo Peirce, lo affermiamo per un’abitudine non per un giudizio individuale. Approssimativamente, un ragionevole grado di convinzione = proporzione di casi in cui questa abitudine porta alla verità. Ma nel cercare di essere più precisi si incontrano le seguenti difficoltà:

(1) Non si può sempre prendere l’abitudine presente: potrebbe in modo corretto essere derivata da una qualche precedente esperienza accidentalmente fuorviante. Allora guardiamo ad una più larga abitudine a formare una tale abitudine.

(2) Non possiamo fornire una percentuale di casi reali; ad esempio in un gioco di carte a cui si gioca molto raramente, così che delle particolari combinazione in questione ci sono pochissimi casi effettivi.

(3) A volte effettivamente accettiamo una teoria del mondo con alcune leggi e alcune possibilità, e intendiamo non la percentuale dei casi effettivi ma quale è la probabilità della nostra teoria.

(4) Ma si potrebbe sostenere che questa complicazione non sarebbe necessaria a causa della (1) per la quale noi prendiamo in considerazione solo le abitudini molto generali, delle quali ci così sono tanti esempi che, se la probabilità secondo la nostra teoria differisse dalla percentuale effettiva, la nostra teoria dovrebbe essere sbagliata.

(5) Anche in un caso basilare come l’induzione, potrebbe non esserci alcuna possibilità per esso: questo non è il caso di cose riguardanti una probabilità.

Fortunatamente non vi è alcun motivo per fissare in un preciso il senso di ‘ragionevole’; questo potrebbe essere imposto solo per uno o due motivi: o perché il ragionevole sarebbe il soggetto argomento di una scienza (che non è il caso); o perché ci aiuterebbe ad essere razionali per conoscere cosa è una ragionevolezza (che non ci aiuta, sebbene alcune false opinioni potrebbero impedircelo). Per rendere chiaro che non è necessario per ambedue questi scopi si deve considerare (1) il contenuto della logica

e (2) l’utilità della logica.

IL CONTENUTO DELLA LOGICA

(1) Preliminare all’indagine filosofico-psicologica sulla natura del pensiero, sulla verità e ragionevolezza.

(2) Formule per la deduzione formale = matematica.

(3) Indicazioni per evitare confusione (appartiene alla psicologia medica).

(4) Schema della maggior parte delle proposizioni generali conosciute o utilizzate come abitudini di inferenza da un punto di vista astratto; o rozzamente induttivo, come ‘il metodo matematico ha risolto tutti questi altri problemi, quindi … ‘, oppure sistematica, quando viene chiamato metafisica. Tutto questo potrebbe ad ogni modo essere chiamato metafisica; ma è considerato come la logica, quando addotto come avente relazione con un problema irrisolto, non semplicemente come informazione interessante per personale interesse.

L’unica di queste che è una scienza distinta è evidentemente la (2).

L’UTILITÀ DELLA LOGICA

Quella delle sopra indicate (1) (3) sono evidenti: quelli interessanti sono le (2) e (4). (2) = la matematica è indispensabile per manipolare e sistematizzare le nostre conoscenze. Oltre a questo (2) e (4) ci aiutano a in qualche modo a pervenire a delle conclusioni nel giudizio.

 LOGICA COME AUTOCONTROLLO (cfr. Peirce)

L’autocontrollo, in generale, significa o

(1) non agire in base al desiderio temporaneamente dominante, ma fermarsi a riflettere bene su questo; cioè porre attenzione a tutti i desideri e verificare quale è effettivamente il più forte; nella valutazione di questo consiste l’eliminazione delle incoerenze nell’agire;

o (2) disporre come risultato di una abitudine decisionale abitudini ad agire in risposta non a desideri o stimoli occasionali, ma in un modo deciso adeguato ad un desiderio stabile.

La differenza è che in (1) ci fermiamo a pensarci bene ma in (2) ci abbiamo pensato bene prima e ci fermiamo solo a fare ciò che avevano precedentemente deciso di fare.

Così anche la logica ci permette di

  1. Non formulare un giudizio sulla base delle prove immediatamente davanti a noi, ma a fermarci a pensare a tutto il resto che noi riteniamo in qualche modo pertinente. Ci permette di non essere incoerenti, e anche di porre attenzione alle questioni veramente generali, ad esempio, tutti i corvi che ho visto sono di colore nero, così questo sarà – non un corvo; il colore è in determinate altre specie di uccelli una qualità variabile.. Così, ad esempio non solo argomentare da φa, φb …a (x).φ(x) come probabile, ma il considerare che il sostenere che a, b. . . siano la classe che ho visto (e quelle visibili sono in modo particolare probabilmente o improbabilmente φ). Questa differenza tra selezione influenzata e casuale. 1

1 Vedi infra ‘Chance’.

(2) Il formare certe abitudini fisse di procedura o di interpretazione solo riviste ad intervalli quando pensiamo bene sugli oggetti. In questo è lo stesso di qualsiasi giudizio generale; dobbiamo solo considerare il processo come ‘logico’ quando è molto generale, non ad esempio aspettarsi che una donna sia infedele, ma ad esempio di respingere coefficienti di correlazione con un errore probabile più grande di loro.

Per quanto riguarda la formazione di un giudizio o una giudizio parziale (che è una decisione che corrisponde ad un grado di convinzione di un certo grado, cioè ad agire in un certo modo), si deve notare che: –

(a) Quello che domandiamo è ‘p?’ non ‘Sarebbe giusto pensare p? ‘Né ‘ Sarebbe ragionevole pensare p? ‘ (Ma questi potrebbero essere utili primi passi.)

ma (b) ‘Sarebbe vero pensare p?’ non può mai essere determinata senza determinare a cosa corrisponda p.

(c) ‘Sarebbe ragionevole pensare p?’ significa semplicemente ‘ è p quanto accade di solito in un caso del genere?’ ed è vago come ‘solito’. Porre questa domanda ci potrebbe aiutare, ma spesso non sembra più facile rispondere che p stessa.

(d) non può neppure essere fissato il preciso significato in cui ‘ragionevole’ o ‘solito’ può essere utilmente adottato, né assegnato un peso per qualche principio a diverse considerazioni di tal sorta. Ad esempio il tasso di mortalità per gli uomini di 60 anni è di 1/10, ma tutti i 20 sessantenni dai capelli rossi che ho conosciuto hanno vissuto fino a 70 anni. Cosa mi dovrei attendere dei nuovi sessantenni dai capelli rossi? Non posso che mettere le prove davanti a me, e lasciare che agiscano nella mia mente. Vi è un conflitto di due ‘di solito’, che deve venir elaborato nella mia mente; uno non è realmente ragionevole, l’altro è effettivamente ragionevole.

(e) Tuttavia, quando la prova è molto complicata, le statistiche vengono introdotte per semplificarla. Queste devono essere scelte in modo tale da influenzare me quanto più possibile nello stesso modo come farebbe l’insieme dei fatti che essi rappresentano se riuscissi a comprenderli con chiarezza. Ma questo non può essere del tutto ridotto a una formula; il resto della mia conoscenza può influenzare la questione; quindi p può essere equivalente in influenza a q, ma non ph a qh.

(f) Ci sono casi eccezionali in cui ‘Sarebbe ragionevole pensare p’ risolve completamente l’argomento. Così, se ci viene detto che uno dei nomi di queste persone inizia con A e che ci sono 8 di queste persone, è ragionevole credere con grado un ottavo che il nome di qualche particolare nome inizia con A, e questo è ciò che dovremmo fare tutti (a meno che non sentissimo che ci sia qualche qualcosa di pertinente).

(g) Tuttavia, introdurre l’idea di ‘ragionevole’ è in realtà un errore; ma sarebbe meglio dire ‘solitamente’, che rende evidente l’indeterminatezza dell’insieme: ciò che è ragionevole dipende da ciò che viene assunto come importante; se assumiamo come abbastanza importante, se è ragionevole pensare p diventa almeno un problema difficile come p. Se prendiamo tutto come importante è la stessa cosa.

(h) Cosa dovremmo prendere come importante? Quel genere di cose che è utile prendere come importanti; se mettessimo in relazione con l’essere importante con riferimento a quello che assumiamo come importante, questo potrebbe significare ogni cosa. Altrimenti è impossibile affermarlo; ma il problema è quello posto dall’osservatore non dalla persona stessa che pensa: se il pensatore sente un oggetto importante non può eliminarlo; e se lo sente irrilevante non potrà usarlo.

(i) Solo quindi, se sentiamo in realtà essere molto poco importante, o rispondiamo o possiamo rispondere alla domanda con un riferimento a ciò che è ragionevole, essendo questo quindi equivalente a ciò che noi riconosciamo e consideriamo importante.

(j) Quello che viene o non viene preso come importante sono non solo le proposizioni ma anche gli oggetti formali, ad esempio a=a: noi possiamo reagire diversamente a φa che a qualsiasi φx non per qualcosa che sappiamo circa a ma ad esempio per ragioni emotive.

 B. STATISTICHE

La scienza statistica si occupa di sintesi di fatti circa numerosi individui che vengono interpretati come una selezione casuale da una ‘popolazione’ infinita. Se le qualità in questione sono discrete, questo significa semplicemente che si considerano le percentuali degli individui osservati che hanno certe qualità, e attribuire queste percentuali alla ipotetica popolazione. Se le qualità sono continue, assumiamo che la popolazione sia di una opportuna forma semplice contenente vari parametri che vengono poi scelti per dare la massima probabilità agli esempi oggetto di osservazione. In entrambi i casi l’errore probabile viene calcolato per un certo campione estratto da una certa popolazione. (Per tutto questo si veda Fisher).1

Il significato di questa procedura è che registriamo in una semplice conveniente forma

(1) Le percentuali approssimative aventi le caratteristiche date in gradi diversi,

(2) Il numero di esempi che abbiamo osservato (il peso della nostra induzione) (errore probabile).

Per l’utilizzo dei numeri per dare un grado di convinzione per quanto riguarda un nuovo esempio non può essere data nessuna regola.

L’introduzione di una popolazione infinita è una invenzione stupida, che non può essere difesa se non attraverso qualche riferimento a procedure ad un limite, che ne distrugge il significato. La procedura di calcolare i parametri per massima verosimiglianza e probabile errore può essere definito come un processo di matematica pura; il suo significato è nel suggerire una teoria o un insieme  di probabilità. La percentuale di una popolazione infinita dovrebbe essere sostituita dalla probabilità.

Ovviamente lo scopo non è sempre la semplice induzione ma l’analisi causale: troviamo che le probabilità non sono quello che ci aspettiamo, quindi o il dado è truccato o adesso le persone sono più accurate, ecc.

1 “Teoria della stima statistica,” [p.204] RA Fisher, Proc. Camb. Phil. Soc., 22, pp.700-725 (1925), and Statistical Methods for Research Workers.

C. PROBABILITA’

(1) Non esistono cose come probabilità oggettive, nel senso in cui alcune persone immaginano che ci siano, ad esempio, N. Campbell, Nisbet.1

Non esiste, per esempio, nessun dato di fatto nella forma ‘In n consecutivi lanci il numero di teste si trova compreso tra n/2±ε(n)’. Al contrario, abbiamo buoni motivi di ritenere che una legge del genere sarebbe rotta, se prendiamo abbastanza casi di questi lanci.

Né esiste un qualche dato di fatto determinato empiricamente su una serie infinita di lanci; questa formulazione viene adottata solo per evitare una contraddizione con l’esperienza; e ciò che nessuna esperienza può contraddire, nessuna esperienza può confermare, permette solo di non parlare di enunciarlo.

(N. Campbell fa un semplice errore in questo.)

Una teoria grezza della frequenza è inammissibile poiché essa giustifica la ragione della ‘maturità delle probabilità’, ad esempio con riguardo al sesso della prole.

(2) Quindi le probabilità devono essere definite attraverso i gradi di convinzione; ma essi non corrispondono a nessuno effettivo grado di convinzione; le probabilità di 1.000 volte tasta e di 999 seguita da croce, sono uguali, ma tutti si aspetterebbero più le prime rispetto alle seconde.

(3) Le probabilità sono gradi di convinzione all’interno di un determinato sistema di convinzioni e di gradi di convinzione; non quelli di qualsiasi persona reale, ma in un sistema semplificato a cui quelli di persone reali, specialmente di chi parla, in parte si approssimano.

(4) Questo sistema di convinzioni è costituito, in primo luogo, delle leggi naturali, che sono in questo date per certe, sebbene, naturalmente, le persone non siano in realtà abbastanza sicure di queste.

(5) Oltre a ciò il sistema contiene vari oggetti di questo genere: quando conoscendo ψx e null’altro di importante, si aspetta sempre φx con grado di convinzione p (ciò che è o non è importante è anche specificato nel sistema); che si può anche scrivere che la probabilità di φ dato ψ è p(se p = 1 è lo stessa cosa di una legge). Queste probabilità insieme con le leggi formano un sistema deduttivo secondo le regole di probabilità, e le convinzioni effettive di un utilizzatore del sistema dovrebbe approssimarsi a quelle dedotte da una combinazione del sistema e dalla particolare conoscenza di fatto posseduta dall’utente, questo ultimo essendo (inesattamente) assunto come determinato.

1 R.H. Nisbet, “The Foundation of Probability”, Mind, 1926.

(6) Le probabilità di un tale sistema non devono essere confuse con le frequenze; la probabilità di φx dato ψx potrebbero essere anche diverse dalla frequenza conosciuta di ψ che è φ. Ad esempio la probabilità di una moneta  di dare testa ieri è 1/2 dal momento che ‘ieri’ è irrilevante, ma la percentuale che effettivamente ha dato testa ieri potrebbe essere 1.

(7) E’ evidente, tuttavia, che non siamo provveduti di sistemi che forniscano un grado di convinzione in ogni possibile proposizione per qualsiasi base di conoscenza dei fatti. I nostri sistemi coprono solo parte del campo; e dove non abbiamo un sistema diciamo che non conosciamo le probabilità.

(8) I fenomeni che hanno probabilità sistematiche sono giochi d’azzardo, nascite, morti, e tutti i tipi di coefficienti di correlazione

(9) Cosa si intende per probabilità oggettiva non è solo il nostro avere nel nostro sistema una probabilità φ(x)/ψ(x), ma nel nostro non avere speranza di modificare il nostro sistema in un paio di leggi αx.ψx.⊃x .φx:βx.ψx.⊃x . ∼φx, ecc., dove αx, βx sono disgiunzioni di proprietà facilmente osservabili (precedenti nel tempo a φx). Questo si verifica, come puntualizza Poincaré 1, quando piccole cause producono grandi effetti.

Le probabilità sono in un altro senso oggettive, nel senso in cui tutti sono d’accordo su di esse, a differenza ad esempio per le scommesse sui cavalli.

(10) Cosa si intende per un evento di non essere una coincidenza, o non essere dovuto al caso, è che se andiamo a conoscerlo, ci costringerebbe a non considerare più a lungo il nostro sistema come soddisfacente, anche se nel nostro sistema l’evento può essere più improbabile rispetto a qualsiasi alternativa. Così 1.000 volte testa nel lancio di una moneta non sarebbe dovuto al caso; cioè se lo osservassimo dovremmo cambiare il nostro sistema di probabilità per il lancio di quel penny. Se questo viene chiamato h, le probabilità nel nostro sistema con h come ipotesi sono molto diverse dai nostri gradi effettivi di convinzione in determinati h.

Dicendo che un oggetto non è dovuto al caso, noi solamente intendiamo che il nostro sistema di probabilità deve essere modificato, non che questo deve diventare un sistema di leggi. Così per una moneta truccata che da’ testa non è dovuto alla probabilità anche se non sempre funziona così; per esempio: la probabilità può essere posta ad esempio = 2/3, non 1/2 .

Se diciamo ‘Il nostro incontro non era dovuto al caso’, cioè programmato, la programmazione è solo un fattore che modifica le probabilità; ma potrebbe anche essere ad esempio che stavamo camminando nella stessa strada.

(11) Questo è il motivo per cui N. Campbell pensa che coincidenze non si possano ammettere che avvengano; vale a dire le coincidenze . ⊃ . un sistema errato, ∴ un sistema . ⊃ . nessuna coincidenza. A quanto pare formalmente coerente; ma questo è un errore perché il sistema non è una proposizione che è vera o falsa, ma un’imprecisa approssimazione di uno stato d’animo in cui alcune imperfezioni possono in determinate circostanze risultare particolarmente evidenti.

1Vedi Science et Hypothèse e Science et Méthode.

(12) Con gli oggetti che sono in ultima analisi, dovuti al caso, intendiamo dire che non esiste una legge (qui una generalizzazione di una complessità maggiore di quella gestibile), conosciuta o sconosciuta, che determina il futuro a partire dal passato. Se supponiamo inoltre che hanno probabilità assolute, questo rappresenta una sorta di sistema migliore in cui avere queste probabilità.

(13) Nella scelta di un sistema dobbiamo risolvere con un compromesso tra due principi: fatta salva la condizione che il sistema non deve contraddire i fatti che conosciamo, scegliamo (essendo un altro oggetto equivalente) il sistema più semplice, e (a parità di condizioni) scegliamo il sistema che dia la più alta probabilità ai fatti che abbiamo osservato. Questo ultimo è di ‘principio di massima verosimiglianza ‘ di Fisher, e fornisce l’unico metodo di verifica di un sistema di probabilità.

(14) La probabilità in fisica significa possibilità come spiegato qui, con alcune possibili complessità aggiunte perché siamo interessati ad una ‘teoria’ nel senso di Campbell, non solo ad un sistema normale che è una generalizzazione della legge di Campbell.’ Cosa sia il caso in una teoria è difficile da spiegare fino a che non sapremo di più sulla natura delle teorie.1

1 [Vedi la sezione seguente – Ed. ]

(15) La scienza statistica deve essere brevemente trattata dal nostro punto di vista; essa ha tre parti

(a) Raccolta e ordinamento di una selezione di dati da un una moltitudine di dati

(b) induzione = formare un sistema di probabilità dei dati mediante il Principio di Massima Verosimiglianza.

(c) analisi causale: ad esempio, questo dado cade così spesso in questo modo in su, quindi il suo centro di gravità deve essere spostato verso la faccia opposta.

(16) L’unica difficoltà è presente in relazione a (c) analisi causale, in cui ci sembra di fare una asserzione di probabilità come un fatto, e di sostenere ‘il dare così spesso sei non è dovuto al caso’‚ ∴ probabilità > 1/6 ∴ centro di gravità spostato. Ragionamento che sembra incompatibile con la nostra soluzione del paradosso che ‘la probabilità = 1/6’, è incoerente con questa coincidenza che era che ‘la probabilità =1/6’, la probabilità >1/6’ non sarebbero proposizioni e pertanto non potrebbero servire come premesse e conclusioni di ragionamenti.

(17) La difficoltà viene rimossa dall’osservazione che il sistema che in definitiva stiamo utilizzando non solo ci fornisce il grado di convinzione o di probabilità di x di dare sei assumendo che x sia lanciato = 1/6, ma anche una probabilità di x di dare sei dato che x viene lanciato ed è truccato >1/6. Di conseguenza, dal recepimento che x è truccato/ x esce sei volte che x è lanciato > che x è truccato/ x è lanciato. Se a/bh> a/h, allora b/ah>b/h e questo è come dovremmo pensare. La probabilità di a che x lanciato dia sei è p sembra si debba trattare come una vera proposizione, ma quello che realmente intendiamo è una condizione non esplicita, che nel nostro sistema nel momento che viene aggiunto alle ipotesi determina la probabilità p.

(18) Possiamo affermare questo così: l’analisi casuale statistica presuppone un sistema basilare all’interno del quale si muove e che lo lascia immutato; questa non è né sembra possa essere trattata come una proposizione. Ciò che sembra si possa trattare così è un più ristretto sistema derivato o derivabile dal sistema principale con l’aggiunta di una premessa empirica, e ciò che è effettivamente trattato come una proposizione e modificato o respinto non è il sistema più ristretto, ma la premessa empirica su cui essa si basa.

Naturalmente questa premessa empirica può essere sconosciuta o molto vagamente conosciuta; ad esempio, concludo dal fatto che sono nati più ragazzi che ragazze da una certa superiorità numerica, una superiore mobilità, o capacità di fecondazione di spermatozoi con caratteri maschili o per una delle mille altre possibili cause, perché per il Principio di Indifferenza, che fa parte del mio sistema fondamentale, la differenza osservata sarebbe così inverosimile se non ci fosse una tale differenza. Ma qui non sembra esserci una differenza fondamentale tra questo caso e la moneta truccata.

(19) Note sul problema di Poincaré ‘Perché gli eventi casuali sono soggetti ad una legge?’ La risposta principale a questo è che non lo sono, assumendo che nell’intero campo degli eventi casuali non sono possibili generalizzazioni su di essi (si pensi ad esempio alle malattie infettive, i dattili negli esametri, i morti per calci di cavalli, le nascite di grandi uomini).

Poincaré dice che è paradossale che l’attuario possa derivare dall’ignoranza così semplici ed utili conclusioni mentre se conoscesse le leggi della salute dovrebbe passare attraverso calcoli senza fine. In realtà egli opera non per ignoranza, ma per esperienza di frequenze.

(20) Nota su ‘casuale’.

Keynes 1 fornisce un resoconto sostanzialmente corretta di questo. Ma

(a) E’ essenziale introdurre il concetto di una descrizione.  Quello che vogliamo non è che a sia un membro  casuale di Schermata 2013-08-22 alle 18.42.59      (Sx) con lo scopo φx, ma la descrizione (ιx)(ψx) è una descrizione casuale quando x= (ιx)(ψx) è trascurabile rispetto a φx/Sx.h.

(b) E’ indispensabile estendere il termine per coprire non solo una selezione di un  termine, ma di molti; quindi, che ψ  Schermata 2013-08-22 alle 18.42.59      fornisce una selezione casuale di n di S in riferimento a φ Schermata 2013-08-22 alle 18.42.59   significa che a= Schermata 2013-08-22 alle 18.42.59    (ψx) è irrilevante alla probabilità nella forma: Rapporto di α che è φ= λ/α∊n.α⊃ Schermata 2013-08-22 alle 18.42.59   (S(x).h.

L’idea di selezione casuale è utile nell’induzione, in cui il valore del ragionamento ‘Un rapporto λ su ψS è uguale a φ’ ∴ che ‘ Un rapporto λ su S è uguale a φ’ dipende se ψ è un selettore casuale. Se λ=1 naturalmente il valore del ragionamento è rafforzato se ψ è affetto da errore sistematico contro φ, indebolito se φ è affetto da errore sistematico in favore di questo.

Treatise on Probability, P.291.

DAL CAP. IX Ultime carte (1929):

C. PROBABILITA’ E CONVINZIONE PARZIALE

Il difetto del mio saggio sulla probabilità era che ho assunto la convinzione parziale come un fenomeno psicologico definibile e misurabile  da uno psicologo. Ma questo tipo di psicologia è molto poco accettabile e sarebbe abbastanza inaccettabile in una scienza sviluppata. In effetti la nozione di un grado di convinzione 2/3 è inutile per un osservatore esterno, tranne quando viene usato dallo stesso che pensa e che dice: ‘Be’, io credo in una certa misura 2/3′, vale a dire (almeno questo è l’interpretazione più naturale)’ Ho lo stesso grado di convinzione in questo come in p v q quando io considero p,q,r ugualmente verosimili e so che uno di essi è vero.’ Ora, qual è il concetto di questo confronto numerico? come viene utilizzato il numero? In un grande numero di casi viene utilizzato semplicemente come base per ottenere altri numeri dello stesso tipo derivandone alla fine in un caso circa prossimo a zero o ad 1 che viene assunto essere 0 o 1 e la parziale convinzione essere una completa convinzione. Ma a volte il numero viene assunto per sé stesso nel prendere una decisione concreta. Come? Vorrei dire conformemente alla legge della speranza matematica, ma non posso farlo, perché potremmo usare solo questa regola se avessimo misurato buoni e cattivi risultati. Ma forse in un certo modo ci avviciniamo ad essa, come avremmo supposto in economia di massimizzare un’utilità non misurata. Il problema si pone anche sul perché proprio questa legge di speranza matematica. La risposta a questo è che se usiamo la probabilità per misurare l’utilità, come spiegato nel mio articolo, allora la coerenza richiede proprio questa legge. Naturalmente se l’utilità fosse misurata in qualsiasi altro modo, ad esempio in denaro, non dovremmo usare la speranza matematica.

Se non sussiste alcun significato nell’equivalente differenza di utilità, allora il denaro è un metodo buono come un altro per misurarla. Un significato può, tuttavia, essere fornito dal nostro metodo probabilistico, o mediante il tempo: ad esempio x – y = y – z se x per 1 giorno e z per 1 giorno = y per 2 giorni. Ma i periodi devono essere lunghi o associato con vite o persone diverse per evitare l’influenza reciproca. Questi due metodi portano allo stesso risultato? Potremmo provarlo con Bernoulli? Ovviamente no; Bernoulli valuta solo le probabilità. Un uomo potrebbe considerare una cosa buona e una cattiva equivalenti a 2 neutre, ma considerare 2 cattive semplicemente come pessime, che non vale la pena di assumere qualsiasi probabilità su di esse (Ma potrebbe essere fatto! No, ci dovrebbe essere una probabilità di non esserlo.) Credo che questo dimostra che il mio metodo di misurazione sia migliore; ma vale solo nell’insieme.

Tutto questo è solo un’idea, che senso c’è davvero in esso? Si può dire, credo, questo: –

Una teoria è un insieme di proposizioni che contiene p e q quando contiene p e q, e se

contiene una qualsiasi p contiene tutte le sue conseguenze logiche. L’interesse di tali insiemi viene dalla possibilità di adottarne una di queste come tutti noi crediamo opportuno.

Una teoria della probabilità è un insieme di numeri associati a coppie di proposizioni che obbediscono al calcolo delle probabilità. L’interesse di tale insieme deriva dalla possibilità di agire su di essi in modo coerente.

Naturalmente, il matematico si occupa solo della forma della probabilità; ma è abbastanza vero che si occupa solo di certezze.

TRUTH AND PROBABILITY- Cap. VII di The Foundation of Mathematics di Frank Plumpton Ramsey

21 Giu

Dennis V. LindleyPropongo la mia traduzione del settimo capitolo di The Foundation of Mathematics di Frank Ramsey pubblicato a cura di R.B. Braithwaite.

Questo capitolo è la base dei moderni sistemi di valutazione in condizioni di incertezza. Grazie a questa magnifica elaborazione matematica di temi complessi e ragionamenti solo in parte elaborati da altri autori tra cui Wittgenstein, Donkin, Pierce e Blake Ramsey ha costruito un sistema matematico solido e straordinariamente valido per la valutazione delle scelte umane basato sull’inscindibilità dei due elementi soggettivi probabilità e utilità dell’esito delle decisioni. Questa metodologia è valida solo per un mondo non deterministico (quindi è il logico e necessario superamento del galileismo nella scienza), libero e razionale. Ramsey prende le mosse dalla contestazione, dal punto di vista logico, dell’ipotesi di Keynes che si possano costruire algoritmi per definire la probabilità in modo oggettivo. Tale metodologia è, purtroppo, ancora in uso da parte di importanti istituzioni pubbliche con la sola finalità di definire le condizioni per non avere problemi con la giustizia se si applicano queste formule. Ma generalmente determina gravi errori di valutazione in quanto rappresenta un metodo per rendere oggettiva una grandezza che non può esserlo in quanto dipende oltre che dalla storia del decisore, dal suo carattere e dal sentimento di utilità che egli attribuisce ad una determinata decisione.

La linea di pensiero di Ramsey è anche importante perché esclude la possibilità di far coincidere l’utilità delle scelte con la teoria filosofica dell’Utilitarismo (qui credo sia ben presente l’influenza di Ludwig Wittgenstein). Si tratta infatti di elementi che apparentemente e solo in taluni casi appaiono convergenti, ma in realtà sono concetti del tutto diversi. L’utilità di una decisione è un numero compreso tra 0 e 1 in quanto si può definire come la probabilità di ottenere la conseguenza migliore per effetto di una decisione.

Rammento ai lettori che il prof. Dennis V. Lindey ha pubblicato sull’argomento un libro divulgativo (Making Decisions- John Wiley and Sons Ltd- 1985) per l’uso del metodo di Ramsey che permette in modo semplice di valutare la coerenza di una decisione indicando i passaggi necessari per pervenirvi. Il concetto di coerenza per le proprie scelte, legato quindi a regole personali, è per definizione un metodo soggettivo che riguarda il singolo decisore.

Il lavoro di Lindley andrebbe completato con l’analisi delle tendenze psicologiche del decisore per rendere maggiormente utile il sistema. 

Il metodo di Keynes, che non tiene conto di questo, porta necessariamente ad errori di valutazione perché è uguale per tutti i decisori. In ultima analisi è un metodo che potrebbe essere gradito ai regimi totalitari o comunque a quei sistemi politici che non considerano la libertà un bene fondamentale e fondante della natura umana.

VII

VERITA’ E PROBABILITÀ (1926)

Dire di che quello che è che non è e di quello che non è che è, è falso mentre il dire di quello che è che è e di quello che non è che non è, è vero. – Aristotele.

Quando diverse ipotesi si presentano alla nostra mente che riteniamo essere reciprocamente esclusive ed esaustive, ma di cui non sappiamo altro, noi distribuiamo equamente la nostra convinzione tra queste…..

Ammettendo questo come motivo del modo in cui effettivamente distribuiamo la nostra convinzione in casi semplici, tutta la successiva teoria segue come deduzione del modo in cui dobbiamo distribuirla in casi complessi, se vogliamo essere coerenti. – W.F. Donkin.

L’oggetto del ragionamento è quello di scoprire, dalla considerazione di quello che già sappiamo, qualcos’altro che non sappiamo. Di conseguenza, il ragionamento è buono  se è tale da dare una vera conclusione da premesse vere, e non altrimenti. – C.S. Peirce.

La verità non può mai essere presentata come se sia da comprendere, e non come se sia da credere. – W. Blake.

PREMESSA

In questo saggio la teoria della probabilità è assunta come un ramo della logica, la logica della parziale convinzione e di materia non completamente definita; ma non vi è alcuna intenzione di implicare che questo è l’unico e anche il più importante aspetto del discorso. La probabilità è di fondamentale importanza non solo nella logica, ma anche nella scienza statistica e nella fisica, e non possiamo essere sicuri in anticipo che la più utile interpretazione di essa nella logica sarà appropriata anche nella fisica. Infatti la differenza principale di opinione fra gli statistici che per la maggior parte adotta la teoria della probabilità sulla base della frequenza e i logici che per lo più la respingono rende probabile che le due scuole stiano veramente discutendo differenti questioni, e che la parola ‘probabilità’ venga usata dai logici in un senso e dagli statistici in un altro. Le conclusioni a cui arriveremo circa il significato di probabilità in logica non devono, pertanto, pregiudicare il suo significato nella fisica.1

1 [Il capitolo finale, sulla probabilità nella scienza, è stato progettato ma non scritto. – Ndr].

SOMMARIO

(1) La teoria della frequenza

(2) La teoria di Keynes

(3) Il gradi di convinzione

(4) La logica della coerenza

(5) The Logica della verità

(1) LA TEORIA  DELLA FREQUENZA

Nella speranza di evitare alcune controversie puramente verbali, mi propongo di iniziare facendo qualche ammissione a favore della teoria della frequenza. In primo luogo, a questa teoria deve essere concesso di avere una solida base nel linguaggio comune, che utilizza spesso ‘probabilità’ praticamente come sinonimo di proporzione; per esempio, se diciamo che la probabilità di guarigione dal vaiolo è di tre quarti, si intende, credo, semplicemente che questa sia la proporzione di casi di vaiolo che guariscono. In secondo luogo, se iniziamo con quello che viene chiamato il calcolo delle probabilità, considerandolo dapprima come un ramo della matematica pura, e poi guardandosi intorno per qualche interpretazione delle formule, che devono dimostrare che i nostri assiomi sono coerenti e il nostro argomento non del tutto inutile, allora la molto più semplice e la meno controversa interpretazione del calcolo è quella in termini di frequenze. Questo è vero non solo della ordinaria matematica della probabilità, ma anche del calcolo simbolico sviluppato da Keynes; perché se nel suo a / h, a e h sono prese per essere non proposizioni, ma funzioni proposizionali o concetti-classe che definiscono classi finite, e per a/h si intende la proporzione di membri di h che sono anche membri di a, allora tutte le sue proposizioni diventano truismi aritmetici.

Oltre a queste due inevitabili considerazioni, ce n’è una terza e più importante, che io sono pronto ad assumere temporaneamente anche se non esprime la mia vera opinione. E questa è la seguente. Supponiamo di Iniziare con il calcolo matematico, e chiedere, non come prima cosa quale interpretazione di esso sia più comoda per il matematismo puro, ma quale interpretazione fornisce i risultati di maggior valore per la scienza in generale, allora può essere che la risposta sia ancora una volta un’interpretazione in termini di frequenza; questa probabilità come viene utilizzata in teorie statistiche, in particolare in meccanica statistica – il tipo di probabilità il cui logaritmo è l’entropia – è realmente un rapporto tra i numeri, di due classi, o il limite di quel rapporto. Non ci credo, ma sono disposto per ora a concedere alla teoria della frequenza che questa probabilità come utilizzata nella scienza moderna sia in realtà la stessa cosa della frequenza.

Ma, supponendo tutto ciò ammesso, rimane ancora il caso che noi abbiamo sia l’autorità del linguaggio comune sia di molti grandi pensatori per discutere sotto il titolo di probabilità quello che sembra essere piuttosto un argomento diverso, la logica della convinzione parziale. Può darsi che, come alcuni sostenitori della teoria della frequenza hanno sostenuto, la logica della convinzione parziale si troverà alla fine essere semplicemente lo studio delle frequenze, sia perché la convinzione parziale sarebbe definibile come, o per relazione, una sorta di frequenza, o perché può essere oggetto di un trattamento logico solo quando si fonda sulla frequenze sperimentali. Se queste affermazioni sono valide possono tuttavia essere stabilite solo come un risultato della nostra indagine sulla convinzione parziale, così che io propongo di ignorare la teoria della frequenza al presente e avviare un’indagine sulla logica della convinzione parziale. In questo, credo, sarà più conveniente se, invece di sviluppare da subito la mia teoria, comincio esaminando le opinioni di Keynes, che sono così ben conosciute e in sostanza così ampiamente accettate che i lettori probabilmente credono che non vi sia alcun motivo per riaprire il tema de novo fino a quando siano state demolite.

(2) LA TEORIA DI KEYNES

Keynes 1 parte dal presupposto che facciamo inferenze di probabilità per le quali asseriamo una validità oggettiva; si procede dalla convinzione piena in una proposizione alla convinzione parziale in un’altra, e noi riteniamo che questa procedura è oggettivamente giusta, in modo che se un altro uomo in circostanze simili avesse un diverso grado di convinzione, in questo sbaglierebbe. La ragione di questa ipotesi di Keynes è di supporre  che fra due qualsiasi proposizioni, date come premesse e conclusioni, esiste solo una ed una sola relazione di un determinato tipo definito relazione di probabilità;  e questo se, in qualsiasi caso dato, la relazione sia di grado α, dalla totale convinzione nelle premessa, noi possiamo, se siamo razionali, pervenire ad un grado di convinzione α nella conclusione.

Prima di criticare questo punto di vista, potrebbe forse essermi consentito di segnalare un evidente e facilmente correggibile difetto nella sua definizione. Quando viene detto che il grado della relazione di probabilità è la stessa del grado di convinzione che la giustifica, sembra essere presupposto che sia i rapporti di probabilità, da un lato, ed i gradi di convinzione, dall’altro possano essere naturalmente espressi in termini numerici e quindi che il numero che esprime o misura il rapporto di probabilità è lo stesso che esprime l’appropriato grado di convinzione. Ma se, come sostiene Keynes, queste cose non sono sempre esprimibili con i numeri, allora non possiamo porre la sua affermazione che il grado dell’una  sia lo stesso dell’altra come una semplice interpretazione, ma si deve supporre che pensi soltanto che esista una corrispondenza biunivoca tra i rapporti di probabilità e i gradi di convinzione che li giustificherebbe. Questa corrispondenza deve conservare evidentemente le relazioni di maggiore e minore, e rendere la varietà delle relazioni di probabilità e quella di gradi di convinzione simili nel senso di Russell. Penso che sia un peccato che Keynes non ha visto questo chiaramente, perché l’esattezza di questa corrispondenza avrebbe fornito materia abbastanza degna per il suo scetticismo come fece sulla misura numerica dei rapporti di probabilità. Infatti alcuni dei suoi argomenti contro la loro misura numerica sembra si applichino abbastanza altrettanto bene contro la loro esatta corrispondenza con i gradi di convinzione; per esempio, sostiene che se i tassi di assicurazione corrispondessero a soggettivi, cioè reali, gradi di convinzione, questi non sarebbero razionalmente determinati, e non potremmo dedurre che le relazioni di probabilità possano essere misurate allo stesso modo. Si potrebbe sostenere che la vera conclusione in tal caso non sarebbe che, come pensa Keynes, alla relazione non -numerica di probabilità  corrisponda un non-numerico grado di convinzione razionale, ma che i gradi di convinzione, che sarebbero sempre numerici, non hanno una corrispondenza biunivoca con le relazioni di probabilità che le giustificano. Perché è, suppongo, concepibile che i gradi di convinzione possano essere misurati da uno psicogalvanometro o qualche strumento simile, e Keynes difficilmente desidererebbe che da ciò seguirebbe che i rapporti di probabilità possano essere per derivazione misurati con le misure delle convinzioni che li giustificano.

1 J.M. Keynes, A Treatise on Probability (1921).

Ma torniamo a una critica più fondamentale delle opinioni di Keynes, che è quell’ovvietà che realmente non sembra che esistano oggetti come i rapporti di probabilità che lui descrive. Lui suppone che, comunque in alcuni casi, possano essere percepiti; ma per quanto mi riguarda mi sento fiducioso che questo non è vero. Io non li percepisco, e se devo essere convinto che esistono, deve essere fatto con ragione; inoltre ho avvedutamente il sospetto che anche gli altri non li percepiscano, perché sono in grado di raggiungere un così piccolo accordo come con quello di essi che si riferisce ad ogni due date proposizioni. Tutto quello che sembra di sapere su di questo sono alcune proposizioni generali, le leggi di addizione e moltiplicazione; è come se tutti conoscessero le leggi della geometria, ma nessuno potesse dire se ogni determinato oggetto fosse rotondo o quadrato; e trovo difficile immaginare come una massa così grande di conoscenza generale possa essere combinata con una così esigua riserva di fatti particolari. E’ vero che su alcuni casi particolari vi sia un accordo, ma questi in qualche modo, paradossalmente, sono sempre immensamente complicati; siamo tutti d’accordo che la probabilità di una moneta lanciata sia testa è 1/2, ma nessuno di noi può dire esattamente quale è la prova che costituisce l’altro termine per la relazione di probabilità intorno alla quale noi stiamo facendo valutazioni. Se, invece, prendiamo le più semplici  coppie possibili di proposizioni come ‘Questo è rosso’ e ‘Questo è blu’ o ‘Questo è rosso’ e ‘Quello è rosso’, le cui relazioni logiche dovrebbero essere le relazioni sicuramente più facili da osservare, nessuno, credo, avrebbe la presunzione di essere sicuro di quale sia la relazione di probabilità che le collega. O, forse, si può pretendere di vedere la relazione, ma non saranno in grado di dire nulla su di essa con certezza, di affermare se sia più o meno di 1/3, o così via. Essi possono, naturalmente, dire che è incomparabile con qualsiasi rapporto numerico, ma una relazione su ciò che così poco può essere detto in modo veritiero sarebbe di scarso uso scientifico e sarebbe difficile convincere uno scettico della sua esistenza. Inoltre questo punto di vista è davvero un po’ paradossale, perché ogni persona che crede nell’induzione deve ammettere che tra ‘Questo è rosso’ come conclusione e ‘Questo è rotondo’, insieme a un miliardo di proposizioni della forma ‘a è rotondo e rosso ‘come prova, c’è una relazione di probabilità finita; ed è difficile supporre che come abbiamo accumulato casi di prova questi sono improvvisamente ad un punto, ad esempio dopo 233 prove, nel quale la relazione di probabilità diventa finita e così comparabile con qualche rapporto numerico.

Mi sembra che se prendiamo le due proposizioni ‘a è rosso’, ‘b è rosso’, non possiamo discernere più di quattro semplici relazioni logiche tra di esse, vale a dire l’identità di forma, identità di predicato, la diversità del soggetto, e l’indipendenza logica di significato. Se qualcuno mi chiedesse quale probabilità darei all’una e all’altra, non dovrei cercare di rispondere meditando sulle proposizioni e cercando di discernere una relazione logica tra di esse, dovrei, piuttosto, provare ad immaginare che una di quelle sia  tutto quello che sapevo, e ad indovinare quale grado di convinzione dovrei avere poi nell’altra. Se io sono stato in grado di fare questo, potrei senza dubbio ancora non essere contento con questo, ma potrei dire ‘Questo è quello che penserei, ma, naturalmente, io sono solo un pazzo ‘e procederei a considerare ciò che un uomo saggio potrebbe pensare e chiamare questo il grado di probabilità. Io discuterò più tardi questo tipo di autocritica, quando svilupperò la mia teoria; tutto ciò che voglio sottolineare qui è che nessuno che valuta un grado di probabilità prende in considerazione semplicemente  le due proposizioni che si suppone essere correlate con esso; egli sempre considera, tra l’altro il suo proprio grado di convinzione effettivo o ipotetico. Questa osservazione mi sembra essere confermata dalla osservazione del mio comportamento; e per essere l’unico modo di rendere conto del fatto che tutti possiamo fornire stime di probabilità in casi presi dalla vita reale, ma siamo del tutto incapaci di farlo nei casi logicamente più semplici in cui, fosse la probabilità una relazione logica, sarebbe più facile da discernere.

Un altro argomento contro la teoria di Keynes può, credo, essere tratto dalla sua incapacità di aderire ad essa coerentemente anche nella discussione principi primi. C’è un passaggio nel suo capitolo sulla misura della probabilità che recita quanto segue: “La probabilità, vedi capitolo 11 (§ 12), relativa in un certo senso ai principi della ragione umana. Il grado di probabilità, che è razionale per noi prendere in considerazione, non ha la pretesa di una intuizione logica perfetta, ed è relativa in parte alle proposizioni secondarie che in realtà conosciamo; e non dipende se una visione logica più perfetta è o non è concepibile. E’ il grado di probabilità a cui conducono questi processi logici, di cui le nostre menti sono capaci; o, nel linguaggio del capitolo II, che quelle proposizioni secondarie giustificano, che in realtà conosciamo. Se non assumiamo questo punto di vista sulla probabilità, se non la limitiamo in questo modo e lo rendiamo, fino a questo punto, relativamente ai poteri umani, siamo del tutto alla deriva nell’ignoto; perché non possiamo mai sapere quale grado di probabilità sarebbe giustificato dalla percezione di relazioni logiche che noi siamo, e sempre dobbiamo essere, incapaci di comprendere.” 1

Questo passaggio mi sembra abbastanza inconciliabile con il punto di vista che Keynes adotta dappertutto tranne in questo e un altro passo simile. Perché egli sostiene in generale che il grado di convinzione che siamo giustificati nel mettere alla conclusione di un argomento è determinato da quale relazione di probabilità unisce tale conclusione alle nostre premesse. C’è un solo rapporto di questo tipo e di conseguenza una sola vera pertinente proposizione secondaria, che, ovviamente, posso o non posso conoscere, ma che è necessariamente indipendente dalla mente umana. Se noi non lo sappiamo, non lo sappiamo e non possiamo dire quanto dovremmo credere nella conclusione. Ma spesso, egli suppone, che noi lo sappiamo;  i rapporti di probabilità non sono quelli che siamo incapaci di comprendere. Ma su questo punto di vista l’argomento del passo sopra citato non ha alcun significato: le relazioni che giustificano le probabili convinzioni sono relazioni di probabilità, e non ha senso dire di loro che sono giustificate da relazioni logiche che noi siamo, e dobbiamo sempre essere, incapaci di comprendere.

Il significato del passaggio per il nostro scopo attuale sta nel fatto che esso sembra presupporre un diverso punto di vista sulla probabilità, in cui rapporti di probabilità indefinibili non giocano alcun ruolo, ma in cui il grado di convinzione razionale dipende da una varietà di relazioni logiche. Per esempio, ci potrebbe essere tra la premessa e la conclusione la relazione che la premessa era il prodotto logico di un migliaio esempi di una generalizzazione la conclusione della quale era un altro esempio, e questa relazione, che non è un rapporto di probabilità indefinibile ma definibile in termini di logica ordinaria e così facilmente riconoscibile, potrebbe giustificare un certo grado di convinzione nelle conclusioni da parte di uno che credesse nelle premesse. Dovremmo quindi avere una varietà di ordinarie relazioni logiche che giustificano lo stesso o gradi diversi di convinzione. Dire che la probabilità di a dato h era così e così significherebbe che tra a e h esiste una relazione che giustifichi tale-e-tale grado di convinzione. E da questo punto di vista sarebbe un vero e proprio punto essenziale che la relazione in questione non deve essere una relazione che la mente umana sia incapace di comprendere.

1 p. 32, corsivo nel testo.

Questo secondo punto di vista della probabilità come dipendente da relazioni logiche, ma non per sé una nuova relazione logica mi sembra più plausibile della usuale teoria di Keynes; ma questo non vuol dire che mi sento affatto propenso a concordare con lui. Questo richiederebbe  l’idea un po ‘oscura di una relazione logica che giustifica un  grado di convinzione, che non vorrei accettare come indefinibile perché non sembra essere del tutto un concetto chiaro e semplice. Inoltre è difficile dire quali relazioni logiche giustificano quali gradi di convinzione, e perché; qualsiasi decisione in questo senso sarebbe arbitraria, e porterebbe ad una logica di probabilità costituita da una moltitudine di cosiddetti “necessari” fatti, come la logica formale secondo il punto di vita di  Chadwick sulle constanti logiche. 1 Al contrario io penso sia molto meglio cercare una spiegazione di questa ‘necessità sul modello di lavoro di Wittgenstein, che ci permette di vedere chiaramente in quale preciso senso e perché le proposizioni logiche sono necessarie, e in maniera generale perché il sistema della logica formale è composto di  proposizioni di cui è composto, e quale è la sua caratteristica comune. Come la scienza naturale cerca di spiegare e calcolare i fatti della natura, così la filosofia dovrebbe cercare, in un certo senso, di spiegare e calcolare i fatti di logica; un compito ignorato dalla filosofia che respinge questi fatti come non calcolabili e in un senso indefinibile ‘necessari’.

Qui mi propongo di concludere questa critica della teoria di Keynes, non perché non ci siano altri aspetti nei quali sembra offrire il fianco ad obiezioni, ma perché spero che quello che ho già detto sia sufficiente a dimostrare che non è così del tutto soddisfacente da rendere inutile qualsiasi tentativo di trattare la teoria da un punto di vista piuttosto diverso.

J.A. Chadwick “Logical Constants”, Mind, 1927.

(3) GRADI DI CONVINZIONE

L’oggetto della nostra indagine è la logica della convinzione parziale, e non credo che possiamo affrontarla a meno che abbiamo almeno una nozione approssimativa di ciò che sia la convinzione parziale, e come, se non altro, può essere misurata. Non sarà molto illuminante sentirsi dire che in certe circostanze sarebbe razionale credere una proposizione nella misura di 2/3, a meno che sappiamo che cosa significa questo tipo di convinzione in ciò. Dobbiamo quindi cercare di sviluppare un metodo puramente psicologico della misura della convinzione. Non è abbastanza misurare la probabilità; al fine di assegnare correttamente la nostra convinzione alla probabilità dobbiamo anche essere in grado di misurare la nostra convinzione. E’ comune opinione che la convinzione e altre variabili psicologiche non siano misurabili, e se questo fosse vero la nostra indagine sarebbe vana;  e così sarebbe tutta la teoria della probabilità concepita come la logica della parziale convinzione; perché se la frase ‘una convinzione di due terzi di certezza’ fosse priva di significato, un calcolo il cui unico obiettivo sia imporre tali convinzioni sarebbe anche privo di senso. Quindi a meno che non siamo disposti a rinunciare a tutta la faccenda come un cattivo lavoro noi siamo tenuti a sostenere che le convinzioni possono in qualche misura essere misurate. Se dovessimo seguire l’analogia di Keynes nel trattare le probabilità dovremmo dire che alcune convinzioni sarebbero misurabili e altre no; ma questa probabilmente non mi sembra essere un considerazione corretta della questione: non vedo come si possa dividere nettamente le convinzioni in quelle che hanno una posizione nella scala numerica e quelli che non l’hanno. Ma penso che le convinzioni si differenziano in misurabilità nei seguenti due modi. In primo luogo, alcune convinzioni  possono essere misurate più accuratamente di altre; e, in secondo luogo, la misurazione delle convinzioni è abbastanza certamente un processo ambiguo che conduce ad una risposta variabile a seconda di come esattamente la misurazione viene effettuata. Il grado di convinzione a questo proposito è come l’intervallo di tempo tra due eventi; prima di Einstein si considerava che tutti i metodi ordinari di misura di un intervallo di tempo avrebbero dovuto portare allo stesso risultato se effettuata correttamente. 1  Einstein ha dimostrato che questo non era il caso; e l’intervallo di tempo non può più essere considerato come una nozione precisa, ma deve essere abbandonato in tutte le indagini precise. Tuttavia, l’intervallo di tempo e il sistema newtoniano sono sufficientemente accurati per molti scopi e più  facili da applicare. Cercherò di argomentare in seguito che il grado di una convinzione è come un intervallo di tempo; non ha un preciso significato a meno che si specifichi più precisamente come debba essere misurato. Ma per molti scopi possiamo supporre che i modi alternativi di misurarlo portano allo stesso risultato, anche se questo è solo approssimativamente vero. Le discrepanze risultanti sono più evidenti in connessione con alcune convinzioni che con altre, e queste dunque appaiono meno misurabili. Entrambi questi tipi di carenze nella misurabilità, dovuti rispettivamente alla difficoltà di ottenere una misura sufficientemente esatta e ad una importante ambiguità nella definizione del processo di misura, si verificano anche nella fisica e così non sono difficoltà peculiari del nostro problema; quello che è peculiare è che è difficile formulare qualsiasi idea di come la misurazione debba essere effettuata, come l’unità di misura si debba ricavare, e così via. Consideriamo quindi ciò che è implicito nella misurazione delle convinzioni. Un sistema soddisfacente deve in primo luogo assegnare ad ogni convinzione una grandezza o misura avente una precisa posizione in un ordine di grandezza; convinzioni che siano dello stesso grado di convinzione devono  avere la stessa misura dell’una e dell’altra, e così via. Naturalmente questo non può essere realizzato senza introdurre una certa quantità di ipotesi o invenzioni. Anche in fisica non si può sostenere che oggetti che sono uguali a qualche cosa siano uguali l’uno all’altro senza porre ‘uguale’ non con il significato ‘percettibilmente uguale’, ma come un’invenzione o una relazione ipotetica. Non voglio discutere la metafisica o epistemologia di questo processo, ma solo  sottolineare che se è ammissibile in fisica, sarà anche ammissibile in psicologia. La semplicità logica caratteristica delle relazioni trattate in una scienza non viene ottenuta per sua sola natura senza alcuna mescolanza con l’invenzione. Ma il costruire una tale serie ordinata di gradi non è tutto l’insieme del nostro lavoro; dobbiamo anche assegnare valori numerici a questi gradi in qualche modo intelligibile. Ovviamente possiamo facilmente spiegare che indichiamo piena convinzione con 1, la convinzione piena nell’opposto con 0, e le uguali convinzioni in una proposizione e la sua contraddizione con 1/2. Ma non è così semplice dire cosa si intende con una convinzione di certezza pari a 2/3, o che una convinzione in una proposizione sia due volte più forte che la sua contraddizione. Questa è la parte più difficile del lavoro, ma è assolutamente necessaria; perché noi calcoliamo le probabilità numeriche, e se queste corrispondono al grado di convinzione noi dobbiamo scoprire qualche modo definito di assegnare numeri ai gradi di convinzione. In fisica spesso si attribuiscono i numeri scoprendo un processo fisico di addizione 1: il numero per la misura di lunghezze non viene assegnato arbitrariamente soggetto soltanto alla condizione che una maggiore lunghezza deve avere una misura più grande; noi la determiniamo ulteriormente stabilendo un significato fisico per l’addizione; la lunghezza ottenuta mettendo insieme due date lunghezze deve avere per la sua misura la somma delle singole misure. Un sistema di misura in cui non vi è nulla che corrisponde a questo viene immediatamente riconosciuto come arbitrario, per esempio la scala di durezza 1 di Mohs in cui 10 è assegnato arbitrariamente al diamante, il materiale più duro conosciuto, 9 al successivo più duro, e così via.

1 Vedi N. Campbell, Physics The Elements (1920), p.277.

1 Ibid., p.271.

Dobbiamo quindi trovare un processo di addizione per i gradi di convinzione, o un qualche  sostituto a questo che sia ugualmente adeguato a definire una scala numerica. Questo è il nostro problema: come si risolve? Ci sono, credo, due modi da cui possiamo iniziare. Possiamo, in primo luogo, supporre che il grado di una convinzione sia qualcosa di percepibile da chi lo possiede; ad esempio che le convinzioni differiscano nell’intensità della sensazione da cui sono accompagnate, che potrebbe essere chiamata un sentimento di convinzione o sensazione di convincimento, e che per grado di convinzione intendiamo l’intensità di questo sentimento. Questo punto di vista sarebbe molto scomodo, perché non è facile attribuire numeri all’intensità dei sentimenti; ma a parte questo mi sembra palesemente falso, perché le convinzioni che abbiamo più fortemente sono spesso accompagnate praticamente affatto da nessuna sensazione;  nessuno sente fortemente cose che dà per scontate. Siamo quindi condotti alla seconda ipotesi che il grado di una convinzione sia una proprietà causale di ciò, che possiamo esprimere vagamente come il campo di applicazione in cui siamo pronti ad agire con esso. Questa è una generalizzazione del noto punto di vista, che la differenza di convinzione sta nella sua efficacia causale, che viene discusso da Russell nella sua Analysis of Mind. Egli in quell’opera la respinge per due motivi, uno dei quali sembra completamente mancare il punto. Egli sostiene che nel corso della serie dei pensieri, noi concepiamo molte cose che non danno luogo ad azione. Questa obiezione, tuttavia, è vicina a cogliere nel segno, in quanto non si afferma che una convinzione sia un’idea che effettivamente porta ad una azione, ma che porterebbe all’azione in opportune circostanze; proprio come una zolletta di arsenico è detta velenosa, non perché in realtà ha ucciso o ucciderà qualcuno, ma perché potrebbe uccidere chiunque la mangiasse. Il secondo argomento di Russell, tuttavia, è più arduo. Egli fa notare che non è possibile supporre che le convinzioni differiscano dalle altre idee solo per i loro effetti, perché altrimenti se fossero identiche anche i loro effetti sarebbero identici. Questo è perfettamente vero, ma può ancora restare il caso che la natura della differenza tra le cause sia o completamente sconosciuta o molto vagamente nota, e che quello di cui vogliamo parlare sia la differenza tra gli effetti, che è immediatamente osservabile e rilevante. Non appena noi consideriamo una convinzione quantitativamente, questo mi sembra l’unico punto di vista che possiamo avere su di essa. Si potrebbe giustamente considerare che la differenza tra credere e non credere stia nella presenza o assenza di sentimenti introspettivamente. Ma quando cerchiamo di conoscere quale sia la differenza tra credere con più certezza e credere con meno certezza, non possiamo più considerarlo come definibile nell’avere più o meno di una certa sensazione osservabile; almeno io personalmente non sono in grado di riconoscere sentimenti di questo genere. Mi sembra che la differenza si trovi in fino a che punto dovremmo agire in base a queste convinzioni: questo può dipendere dal grado di qualche sensazione o sensazioni, ma non so esattamente quali sensazioni e non penso che sia indispensabile che le conosciamo. Proprio la stessa cosa si trova nella fisica; si è trovato che un cavo che collega lastre di zinco e rame poste in un acido devia un ago magnetico posto nelle sue vicinanze. Di conseguenza, se l’ago viene più o meno deviato si dice che il filo elettrico porta una corrente più o meno grande. La natura di questa ‘corrente’ può essere solo ipotizzata: quello che viene osservato e misurato sono semplicemente i suoi effetti. Si può senza dubbio obiettare che noi sappiamo con quanta forza crediamo in oggetti, e che possiamo conoscere questo solo se siamo in grado di misurare la nostra convinzione per introspezione. Questo non mi sembra necessariamente vero;  in molti casi, credo, il nostro giudizio sulla forza della nostra convinzione è realmente su come agiremmo in ipotetiche circostanze. Si potrebbe rispondere che possiamo solo dire come agiremmo osservando l’attuale sensazione di convincimento che determina il modo in cui agiremmo; ma ancora una volta dubito la cogenza dell’argomento. E’  possibile che ciò che determina il modo in cui agiremmo ci determina anche, direttamente o indirettamente ad avere una corretta opinione su come agiremmo,  senza che ciò mai giunga nella consapevolezza. Supponiamo, tuttavia, che mi sbagli su questo e che possiamo decidere per introspezione la natura della convinzione, e misurarne il grado; pertanto, io sosterrei, il tipo di misura di convinzione con cui la probabilità è interessata non è di questo tipo, ma è una misura della convinzioni su qualche base di azione. Questo io penso si possa mostrare in due modi. In primo luogo, considerando la scala di probabilità tra 0 e 1, e il tipo di modo di usarlo, vedremo che è molto appropriato per la misura della convinzione come base di un’azione, ma in nessun modo correlato alla misura di una introspettiva sensazione. Perché le unità nei termini in cui  sono misurate tali sensazioni o sentimenti sono sempre, penso, differenze che sono appena percettibili: non c’è altro modo di ottenere tali unità. Ma non vedo alcuna ragione per supporre che l’intervallo tra una convinzione di grado 1/3 e una di grado 1/2 sia composto da alquante appena percettibili modifiche così come quella tra una di 2/3 ed una di 5/8, o che questa scala basata su appena percettibili differenze non avrebbe alcuna semplice relazione con la teoria della probabilità. D’altra parte la probabilità di 1/3 è chiaramente correlata al tipo di convinzione che porterebbe ad una scommessa di 2 a 1, e verrà illustrato di seguito come generalizzare questo rapporto in modo da applicarlo ad una azione in generale. In secondo luogo, gli aspetti quantitativi di convinzioni come base di azione sono evidentemente più importanti dell’intensità di una sensazione di convinzione. Questi ultimi sono senza dubbio interessanti, ma possono essere molto variabile da individuo a individuo, e il loro interesse pratico è interamente dovuto alla loro posizione di ipotetiche cause di convinzione per qualche fondamento di una azione. E’ possibile che qualcuno dirà che la misura in cui dovremmo agire sulla base di una convinzione in opportune circostanze è un oggetto ipotetico, e quindi non soggetto a misurazione. Ma dire questo è solo il rivelare l’ignoranza delle scienze fisiche che costantemente si occupano di misurare quantitativi ipotetici; per esempio, l’intensità elettrica in un dato punto è la forza che agirebbe su una carica unitaria se fosse messa in un dato luogo. Cerchiamo ora di trovare un metodo di misurare le convinzioni come fondamento di azioni possibili. E’ chiaro che noi siamo interessati all’intenzione piuttosto che alle convinzioni realizzate; vale a dire, non con le convinzioni al momento in cui pensiamo ad esse, ma alle mie convinzioni come la mia convinzione che la terra è rotonda, a cui raramente penso, ma che guiderebbe la mia azione in ogni caso in cui fosse rilevante. Il vecchio consolidato modo di misurare la convinzione di una persona è quello di proporre una scommessa, e vedere quale sarebbe la più bassa posta che egli accetterebbe. Considero questo metodo fondamentalmente valido, ma ha il difetto di non essere abbastanza generale, e di essere necessariamente inesatto. E’ inesatto parzialmente  a causa del decrescere dell’utilità marginale del denaro, in parte perché una persona può avere entusiasmo o riluttanza a scommettere, perché o gode o detesta questa emozione o per qualsiasi altro motivo, ad esempio, per scrivere un libro. La difficoltà è simile a quella di separare due differenti forze co-operanti. Inoltre, la proposta di una scommessa può alterare inevitabilmente lo stato della sua opinione; così come non potremmo sempre misurare l’intensità elettrica con una effettiva introduzione di una carica elettrica e osservando a quale forza essa è soggetta, perché l’introduzione di una carica cambia la distribuzione che si vuole misurare. Al fine quindi di costruire una teoria quantitativa della convinzione che sarebbe insieme generale ed più esatta, mi propongo di prendere come fondamento una teoria psicologica generale, che è ormai universalmente abbandonata, ma risulta comunque, credo, abbastanza vicina alla verità in una sorta di casi in cui noi siamo più interessati. Mi riferisco alla teoria che noi agiamo nel modo che pensiamo che più probabilmente realizzi gli oggetti del nostro desiderio, in modo che le azioni di una persona sono completamente determinate dai suoi desideri e dalle sue opinioni. Questa teoria non può risultare adeguata a tutti i fatti, ma mi sembra una utile approssimazione alla verità, soprattutto nel caso della nostra vita cosciente o professionale, ed è implicata in grande accordo con il nostro pensiero. Si tratta di una teoria semplice e una teoria che molti psicologi ovviamente gradirebbero mantenere attraverso l’introduzione di desideri inconsci e opinioni inconsce in al fine di renderla più in armonia con i fatti. Non mi sento di giudicare fino a che punto tali ipotesi possano ottenere i risultati richiesti: io solo l’affermo per ciò che segue da una verità approssimativa, o la verità in relazione a questo sistema artificiale di psicologia, che, come la meccanica newtoniana può, io credo, ancora essere utilizzata con profitto anche se è noto per essere errata. Si deve rilevare che questa teoria non deve essere identificata con la psicologia degli Utilitaristi, in cui il piacere ha una posizione dominante. La teoria che propongo di adottare è che cerchiamo le cose che vogliamo, che possono essere per nostro o di altrui piacere, o una qualsiasi altra cosa, e le nostre azioni si verificano per come riteniamo più probabile ottenere questi beni. Ma questa non è una precisa formulazione, perché una precisa formulazione della teoria può essere fatta solo dopo aver introdotto la nozione quantitativa di convinzione. Chiamiamo le cose che una persona desidera in definitiva, ‘beni’, e assumiamo in un primo momento che siano numericamente misurabili e additivi. Vale a dire che se lui preferisce di per sé un’ora di nuoto ad un’ora di lettura, egli preferirà due ore di nuoto a un’ora di nuoto e ad un’ora di lettura. Questo è ovviamente assurdo nel caso specifico, ma questo potrebbe essere solo perché il nuoto e la lettura non sono beni fondamentali, e perché non possiamo immaginare una seconda ora di nuoto esattamente simile alla prima, a causa dell’affaticamento, ecc. Cominciamo col supporre che il nostro soggetto non ha dubbi su nulla, ma sicure opinioni su tutte le proposizioni. Allora possiamo dire che sempre sceglierà il corso di azioni che porteranno secondo la sua opinione alla massima somma di bene. Va sottolineato che in questo esempio bene e male non sono da intendersi in nessun senso etico, ma semplicemente per indicare quello per cui una persona prova desiderio o avversione. Il problema quindi si pone su come dobbiamo modificare questo semplice sistema per tener conto dei diversi gradi di certezza nelle sue convinzioni. Suggerisco che si introduca come legge psicologica che il suo comportamento sia governato da quello che viene chiamato la speranza matematica; vale a dire che, se p è una proposizione su cui egli ha dubbi, ogni bene o male per la cui realizzazione p è a suo avviso una condizione necessaria e sufficiente entrerà nei suoi calcoli moltiplicata per quella frazione, che verrebbe chiamata il ‘grado della sua convinzione in p’. Definiamo così il grado di convinzione in un modo che presuppone l’uso della speranza matematica. Questo si può porre in un modo diverso. Supponiamo che il suo grado di convinzione in p sia m/n; allora la sua azione sarebbe tale come se egli dovesse scegliere di ripeterla esattamente n volte, in m volte delle quali p sarebbe vera, e nelle altre falsa. [Qui sarebbe necessario supporre che in ciascuna delle n volte egli non abbia memoria delle precedenti.] Questo può anche essere preso come una definizione del grado di convinzione, e può essere facilmente considerato come equivalente alla definizione precedente. Diamo un esempio del tipo di casi che potrebbero verificarsi. Io sono ad un bivio e non conosco la strada, ma io piuttosto penso che una delle due strade è quella giusta. Propongo quindi di andare in quella direzione, ma tengo gli occhi aperti per qualcuno a cui chiedere; se adesso vedo qualcuno a mezzo miglio di distanza oltre i campi, se devio per chiedere a lui dipenderà dal relativo disagio di andare fuori dalla mia strada per attraversare i campi o di proseguire sulla strada sbagliata se si tratta della strada sbagliata. Ma dipenderà anche da come sono sicuro che ho ragione; e chiaramente più Io sono sicuro di questo minore sarà la distanza che sarei disposto a percorrere dalla strada (in cui mi trovo) per controllare la mia opinione. Propongo pertanto di utilizzare la distanza che sarei disposto a percorrere per chiedere, come misura della fiducia nella mia opinione; e quello che ho detto sopra spiega come questo deve essere fatto. Possiamo iniziare come segue: supponiamo che l’inconveniente di percorrere x iarde per chiedere sia f(x), il vantaggio  di arrivare alla destinazione giusta sia r, quello di arrivare a quella sbagliata w. Quindi se proprio fossi disposto ad andare ad una distanza d per chiedere, il grado della mia convinzione che io sono sulla strada giusta sarebbe data da

Schermata 2013-12-27 alle 18.29.37

 

 

 

Per una tale azione ci sarebbe uno che mi pagherebbe per farla, se avessi dovuto agire nello stesso modo n volte, in np delle quali ero sulla strada giusta mentre nelle altre no.

Per il bene totale risultante dal non chiedere ogni volta

= npr + n(1-p) w

= nw + np (r – w)

che risulta dal chiedere ad una distanza x ogni volta = nr- nf(x) [io so che vado sempre nella strada giusta]

Questo è più grande dell’espressione precedente, a condizione che

f (x) <(r – w) (1-p),

∴ la distanza critica d è collegata con p, il grado di convinzione, con la relazione f (d) = (r – w) (1-p) o

Schermata 2013-12-27 alle 18.29.37

come affermato sopra.

 

 

E’ facile vedere che questo modo di misurare la convinzione, fornisce risultati in accordo con i concetti ordinari; comunque per estensione la piena convinzione è indicata con 1, piena convinzione in negativo con 0, e pari convinzione tra due con 1/2. Inoltre, ammette la validità della scommessa come mezzo per misurare le convinzioni. Proponendo una scommessa su p diamo al soggetto una possibile condotta di azione da cui risulterebbe tanto supplementare bene per lui se p fosse vero e tanto maggiore male se p è falso. Supponendo la scommessa fosse tra bene e male invece che in denaro, egli scommetterebbe per qualsiasi migliore probabilità di quella che corrisponde al suo stato di convinzione; in realtà il suo stato di convinzione è misurato dalla probabilità che egli precisamente assumerà; ma questo è viziato, come già spiegato, per amore o odio di emozione, e per il fatto che la scommessa è in denaro e non in bene e male. Poiché è universalmente riconosciuto che il denaro ha un’utilità marginale decrescente, se si considerano le scommesse in denaro, è evidente che esse devono essere per quanto possibile di piccola posta. Ma poi di nuovo la misura è guastata introducendo il nuovo fattore di riluttanza a preoccuparsi per inezie.

Vediamo ora di scartare l’ipotesi che il bene sia additivo e immediatamente misurabile, e cerchiamo di elaborare un sistema con meno ipotesi possibili. Per cominciare supponiamo, come prima, che il nostro soggetto ha certe convinzioni su tutto; poi egli agirà in modo che ciò che crede essere le conseguenze complessive della sua azione siano le migliore possibili. Se poi avessimo il potere  dell’Onnipotente, e potessimo convincere il nostro soggetto del nostro potere, potremmo, offrendogli opzioni, scoprire come ha posto in ordine di merito tutti i possibili andamenti del mondo. In questo modo tutti i mondi possibili verrebbero posti in ordine di valore, ma non avremmo un modo esatto di rappresentarli con i numeri. Non avrebbe alcun significato l’affermazione che la differenza di valore tra α e β sia pari a quella tra γ e δ. [Qui e altrove usiamo lettere greche per rappresentare le diverse possibili totalità di eventi tra cui il nostro soggetto sceglie – le definitive organiche unità.]

Supponiamo ora che il soggetto sia in grado di dubitare; allora potremmo provare il suo grado di convinzione in diverse proposizioni facendogli offerte del tipo seguente. Preferiresti avere un mondo α in qualsiasi evento; o un mondo β se p è vero, e un mondo γ se p è falsa? Se, allora, egli fosse certo che che p fosse vero, egli semplicemente confronterebbe α e β e sceglierebbe tra questi come se non ci fossero condizioni fissate; ma se dubitasse della sua scelta non potrebbe decidere in modo così semplice. Propongo di stabilire assiomi e definizioni in merito ai principi che regolano scelte di questo tipo. Questo è, naturalmente, una versione molto schematica della situazione nella vita reale, ma è, credo, più facile da prendere in considerazione in questa forma.

Vi è innanzitutto una difficoltà che deve essere affrontata; le proposizioni p, come nel caso di cui sopra che vengono utilizzate come condizioni nelle varianti offerte possono essere tali che la loro verità o falsità è un oggetto del desiderio per il soggetto. Questo scoprirà che complica il problema, e noi dovremo assumere che ci sono proposizioni per le quali questo non è il caso, che noi chiameremo eticamente neutrali. Più precisamente una proposizione atomica p è detta eticamente neutrale se due mondi possibili che differiscono solo in relazione alla verità di p sono sempre di pari valore; e una proposizione non-atomica p è detta eticamente neutrale se tutti suoi argomenti veri 1 sono eticamente neutrali. 1 Assumo qui la teoria delle proposizioni di Wittgenstein; può essere possibile dare una definizione equivalente nei termini di qualsiasi altra teoria.

Cominciamo con la definizione del grado di convinzione 1/2 in una proposizione eticamente neutrale. Si dice che il soggetto ha un grado di convinzione 1/2 in una certa proposizione p se non ha preferenze tra le opzioni (1), α se p è vero, β se p è falsa, e (2) α se p è falsa, β se p è vera, ma ha semplicemente una preferenza tra α e β. Supponiamo per un assioma che se questo è vero per qualche coppia α, β è vero per tutte le coppie tali. 1 Ciò risulta rozzamente definendo il grado di convinzione 1/2 come quel grado di convinzione che porta all’indifferenza fra lo scommettere in un modo e scommettere nell’altro per la stessa puntata.

Il grado di convinzione 1/2 così definito può essere usato per misurare i valori numericamente nel modo seguente. Dobbiamo spiegare cosa si intende per la differenza di valore tra α e β essere uguale a quello tra γ e δ; e definiamo questo per indicare che, se p è una proposizione eticamente neutrale creduta con il grado 1/2, il soggetto non ha alcuna preferenza tra le opzioni (1) α se p è vera, δ se p è falsa, e (2) β se p è vera, γ se p è falsa.

Questa definizione può costituire la base di un sistema di misurazione dei valori nel modo seguente: –

Chiamiamo qualsiasi insieme di tutti i mondi ugualmente preferibile a un mondo dato un valore: supponiamo che, se il mondo α è preferibile a β qualsiasi mondo con lo stesso valore di α è preferibile a qualsiasi mondo con lo stesso valore di β e possiamo dire che il valore di α è maggiore di quella di β. Questa relazione ‘maggiore di’ ordina i valori in una serie. Useremo α d’ora in poi sia per il mondo sia per suo valore.

Assiomi.

(1) Vi è una proposizione p eticamente neutrale creduta con grado 1/2.

(2) Se p, q sono proposizioni cosiffatte anche l’opzione

α se p, δ se non-p è equivalente a β se p, γ se non-p

allora α se q, δ se non-q è equivalente a β se q, γ se non-q.

Definizione Nel caso di cui sopra si dice αβ = γδ.

Teoremi.  Se αβ=γδ

allora βα=δγ, αγ=βδ, γα=δβ

1 α e β si suppongono così indefinite da essere compatibili sia con p sia con non-p.

(2a) Se αβ = γδ, allora α> β è equivalente a γ> δ

e α = β è equivalente a γ = δ

(3) Se l’opzione A è equivalente all’opzione B e B a C, allora A è equivalente a C.

Teorema. Se αβ = γδ e βη = ζγ

allora  αη = ζδ

(4) Se αβ = γδ, γδ = ηζ, allora  αβ = ηζ.

(5) (α, β, γ). E ! (ικ) (ακ = βγ)

(6) (α, β). E ! (ικ) (ακ = κβ)

(7) Assioma di continuità: – Qualsiasi progressione ha un limite (ordinale).

(8) Assioma di Archimede.

Questi assiomi consentono ai valori di essere correlati biunivocamente con numeri reali in modo che se α1 corrisponde a α, ecc

αβ = γδ . ≣ . α1 – β1 = γ1 – δ1.

D’ora in poi useremo α anche per il correlato numero reale α1.

Avendo così definito un metodo di misurazione del valore possiamo ricavare un modo per misurare la convinzione in generale. Se l’opzione di α certa è indifferente con quella di β, se p è vero e γ se p è falso 1, possiamo definire il grado di convinzione del soggetto in p come il rapporto della differenza tra α e γ sulla differenza tra β e γ; che si deve supporre uguale per tutte le α, β e γ che soddisfano le condizioni. Questo valore grossolanamente per definire il grado di convinzione in p per la probabilità per cui il soggetto scommetterebbe su p, essendo la scommessa gestita nei termini di differenza di valori come definiti. La definizione si applica solo alla convinzione parziale e non include certe convinzioni; perché la convinzione di grado 1 in p, α per certo è indifferente rispetto ad α se p e per ogni β  se non-p.

Qui β deve comprendere la verità di p, γ la sua falsità; p non deve più essere eticamente neutrale. Ma dobbiamo assumere che esiste un mondo con qualsiasi valore assegnato in cui p è vero, e uno in cui p è falso.

Siamo anche in grado di definire una nuova idea molto utile – il ‘grado di convinzione in p dato q’. Questo non significa il grado di convinzione in ‘Se p allora q’, o quello in ‘p implica q’, o quella che il soggetto avrebbe in p se conoscesse q, o quella che dovrebbe avere. Esprime approssimativamente le probabilità per cui egli scommetterebbe ora su p, la scommessa sarebbe valida solo se q fosse vero. Tali scommesse condizionali venivano spesso fatte nel XVIII secolo.

Il grado di convinzione in p dato q si misura così. Supponiamo che un soggetto indifferente tra le opzioni (1) α se q vero, β se q falsa, (2) γ se p vera e q vero, δ se p falsa e q vero, β se q falso. Allora il suo grado di convinzione in p dato q è il rapporto delle differenza tra α e δ sulla differenza tra γ e δ, che dobbiamo supporre le stesse per qualsiasi, α, β, γ, δ che soddisfino le condizioni date. Questa non è la stessa cosa del grado con cui potrebbe credere in p, se credesse certo q; perché la conoscenza di q potrebbe per ragioni psicologiche alterare completamente il suo intero sistema di convincimento.

Ognuna delle nostre definizioni è stata accompagnata da un assioma di coerenza, e nella misura in cui ciò è falso, la nozione di grado di convinzione diviene non più valido. Questo ha una certa analogia con la situazione in materia di simultaneità discussa sopra.

Non ho sviluppato la logica matematica di questo nel dettaglio, perché questo, credo, sarebbe come avere un risultato con sette decimali che è valido con due soli decimali. La mia logica non può essere considerata come in grado di dare più di un di un certo tipo di procedimento che potrebbe funzionare.

Da queste definizioni e assiomi è possibile provare le leggi fondamentali della convinzione probabile (i gradi di convinzione sono compresi tra 0 e 1):

(1) Grado di convinzione in grado p + di convinzione in  Schermata 2013-11-24 alle 21.04.13    = 1

(2) Grado di convinzione in p  dato q + grado di convinzione in  Schermata 2013-11-24 alle 21.04.13  dato q = 1.

(3) Grado di credere in (p e q) = grado di convinzione in p x grado di convinzione in q dato p.

(4) Grado di convinzione in (p e q) + grado di convinzione in (p e Schermata 2013-08-23 alle 22.32.01   ) = grado di convinzione in p.

Le prime due sono di immediata comprensione. La (3) si dimostra come segue.

Sia il grado di convinzione in p = x, quello in q dato p = y.

Allora ξ certo ≣ ξ + (1-x) t se p vero, ξ – xt se p falso per qualsiasi t.

ξ + (1 – x) t se p vero ≣

ξ + (1 – x) + t (1 – y) u se ‘p e q’ veri,

ξ + (1 – x) t – yu se p vero e q falso;  per ogni u

Scegliamo u in modo che ξ + (1 – x) t – yu = ξ – xt,

cioè sia u = t / y (y ≠ 0)

Allora ξ certo ≣

ξ+ (1 – x)t + t (1 – y) t / y se p e q veri,

ξ – xt altrimenti.

∴ il grado di convinzione in ‘p e q’ =  Schermata 2013-12-28 alle 09.25.12        = xy. (t≠0)

Se y = 0, comporta t = 0.

Allora ξ certo ≣ ξ se p vero, ξ se p falso

≣ ξ + u se p vero, q vero;  ξ se p falso, q falso; ξ se p falso

≣ ξ+u, pq vero;  ξ, pq falsa

∴ grado di convinzione in pq = 0.

(4) segue da (2), (3) come segue: –

Grado di convinzione in pq = p x  quello in q dato p, dalla (3).

Allo stesso modo il grado di convinzione in p Schermata 2013-08-23 alle 22.32.01    = quello in p x quello in Schermata 2013-08-23 alle 22.32.01     dato p

∴ la  somma = grado di convinzione in p, per la (2).

Queste sono le leggi della probabilità, che abbiamo dimostrato di essere necessariamente vere per ogni insieme coerente di gradi di convinzione. Qualsiasi insieme definito di gradi di convinzione che le infrange sarebbe incoerente nel senso che ha violato le leggi di preferenza tra le opzioni, come quella che la preferenza è una relazione asimmetrica transitiva, e che se α è preferibile a β, β di certo non può essere preferibile ad α se p, β se non-p. Se la condizione mentale di chiunque viola queste leggi, la sua scelta dipenderebbe dalla forma precisa cui le opzioni gli sono state offerte, il che sarebbe assurdo. Potrebbe assumere una scommessa fatta contro di lui con la migliore astuzia e restare a perdere in ogni caso.

Troviamo, quindi, che un calcolo preciso della natura della convinzione parziale rivela che le leggi della probabilità sono leggi di coerenza, un’estensione alle convinzioni parziali della logica formale, la logica della coerenza. Esse non dipendono per il loro significato da qualsiasi grado di convinzione in una proposizione che risulti essere univocamente determinata come una proposizione razionale: ma semplicemente distinguono gli insiemi di convinzioni che vi obbediscono come quelle coerenti. Avere un qualsiasi grado definito di convinzione implica un certo grado di coerenza, vale a dire la volontà di scommettere su una proposizione data con la stessa probabilità per ogni puntata, essendo la puntata misurata in termini di valori massimi.

Avere gradi di convinzione che obbediscono alle leggi della probabilità implica un’ulteriore misura di coerenza, vale a dire una tale coerenza tra le probabilità accettabili su diverse proposizioni da impedire a una scommessa fatta contro di voi.

Alcune considerazioni conclusive su questa sezione non sarebbero fuori luogo. In primo luogo, queste considerazioni si basano fondamentalmente sulle scommesse, ma questo non sembra irragionevole quando si si sia considerato che in tutta la nostra vite stiamo un certo senso scommettendo. Ogni volta che andiamo alla stazione stiamo scommettendo che un treno effettivamente camminerà, e se non avessimo un sufficiente grado di fiducia in questo rifiuteremmo la scommessa e rimarremmo a casa. Le opzioni che Dio ci da’ sono sempre subordinate al nostro indovinare se una certa proposizione è vera. In secondo luogo, si basa tutto sul concetto di speranza matematica; l’insoddisfazione spesso sentita con questa idea è dovuta principalmente alla misura imprecisa del bene. Chiaramente le aspettative matematiche in termini di denaro non sono adatte guide per il comportamento. Va ricordato, nel giudicare il mio sistema, che in esso un valore viene effettivamente definito mediante la speranza matematica in caso di convinzione di grado 1/2, e così possiamo attenderci che possa essere rappresentato adeguatamente in una scala per una utile applicazione della speranza matematica nel caso di altri gradi di convinzione.

In terzo luogo, nulla è stato detto sui gradi di convinzione quando il numero di alternative è infinito. A proposito di questo non ho niente di utile da dire, tranne che dubito che la mente sia capace di contemplare più di un numero finito di alternative. Si possono prendere in considerazione domande alle quali sia possibile un numero infinito di risposte, ma al fine di esaminare le risposte si devono riunire in un numero finito di gruppi. La difficoltà diventa praticamente rilevante quando si parla di induzione, ma anche allora mi sembra non ci sia necessità di introdurla. Possiamo discutere se l’esperienza passata fornisce un elevata probabilità al levarsi del sole domani senza preoccuparsi di quale probabilità ciò dia al sole di alzarsi ogni mattina per sempre. Per questo motivo non posso ma non intendo che la discussione del problema 1 di Ritchie sia insoddisfacente; è vero che possiamo convenire che le generalizzazioni per induzione  non richiedono nessuna probabilità finita, ma aspettative particolari intrattenute su basi induttive senza dubbio hanno una elevata probabilità numerica nelle menti di tutti noi. Siamo tutti più certi che il sole sorgerà  domani che non avrò 12 con due dadi al primo tiro, ovvero abbiamo una convinzione di grado più elevato di 35/36 in quel caso. Se mai l’induzione richiedesse una giustificazione logica  questa è in rapporto con la probabilità di un evento come questo.

1 A.D. Ritchie, “Induction and Probability”. Mind, 1926. p. 318. ‘La conclusione della discussione precedente può essere messa in modo semplice. Se il problema dell’induzione fosse posto come “Come le generalizzazioni induttive possono acquisire una grande probabilità numerica? ” allora questo è uno pseudo-problema, perché la risposta è “non possono”. Questa risposta, tuttavia,  non è una negazione della validità dell’induzione, ma è una diretta conseguenza della natura della probabilità. Lascia ancora intatto il vero problema dell’induzione che è “Come può essere aumentata la probabilità di una induzione? ” e lascia in piedi l’intera discussione di Keynes su questo punto.’

(4) LA LOGICA DELLA COERENZA

Possiamo essere d’accordo che in un certo senso sia compito della logica di dirci che cosa dobbiamo pensare; ma l’interpretazione di questa affermazione solleva notevoli difficoltà. Si può dire che dobbiamo pensare ciò che è vero, ma in questo senso ci viene detto cosa pensare da tutta la scienza e non semplicemente dalla logica. Né, in questo senso, può essere basata alcuna giustificazione per la convinzione parziale; la cosa migliore idealmente è che avremmo convinzioni di grado 1 in tutte le proposizioni vere e convinzioni di grado 0 in tutte le proposizioni false. Ma questo è un criterio troppo elevato da attendersi da uomini mortali, e dobbiamo convenire che alcuni gradi di dubbio o di errore possono essere umanamente giustificati.

Molti logici, suppongo, accetterebbero come valutazione della loro scienza le parole di apertura di Keynes nel ‘Treatise on Probability’: “parte della nostra conoscenza si ottiene direttamente, e in parte dalla ragione. La teoria della probabilità si occupa della parte che si ottiene con il ragionamento, e tratta dei diversi gradi in cui i risultati così ottenuti sono inoppugnabili o non inoppugnabili. ” Dove Keynes dice: ‘La teoria della probabilità’, altri direbbero la Logica. Si ritiene, vale a dire, che le nostre opinioni possono essere divise in quelle che possediamo immediatamente come risultato della percezione o della memoria, e quelle che ci derivano dal passato per ragionamento. E’ compito della Logica di accettare quanto viene dalla classe del passato e criticare solo la derivazione di una seconda classe da questa.

La logica come scienza del ragionamento e di inferenza è tradizionalmente e giustamente suddivisa in deduttiva e induttiva; ma la differenza e la relazione tra queste due divisioni del soggetto possono essere concepite in modi estremamente diversi. Secondo Keynes i ragionamenti deduttivi e induttivi validi sono fondamentalmente simili; entrambi sono giustificati da relazioni logiche tra premessa e conclusione che differiscono solo nel grado. Non posso accettare questa posizione, come ho già spiegato. Io non vedo cosa queste relazioni logiche inconclusive possano essere o come possano giustificare convinzioni parziali. Nel caso di ragionamenti logici inoppugnabili posso accettare la ragione della loro validità che è stata data da molte autorità, e la stessa si può trovare sostanzialmente in Kant, De Morgan, Peirce e Wittgenstein. Tutti questi autori concordano sul fatto che la conclusione di un argomento formalmente valido è contenuta nelle sue premesse; che negare la conclusione pur accettando le premesse sarebbe auto-contraddittorio; che la deduzione formale non aumenta la nostra conoscenza, ma mette in evidenza chiaramente ciò che già conosciamo in un’altra forma; e che siamo obbligati ad accettare la sua validità a meno di accettare l’incoerenza con noi stessi. La relazione logica che giustifica l’inferenza è che il senso o il valore della conclusione è contenuto in quello delle premesse.

Ma nel caso di un ragionamento induttivo questo non avviene affatto; è impossibile rappresentarlo come se somigliasse ad un ragionamento deduttivo semplicemente di grado più debole; è assurdo dire che il senso della conclusione è parzialmente contenuto in quello delle premesse. Potremmo accettare le premesse e assolutamente respingere la conclusione, senza alcun tipo di incoerenza o contraddizione. Mi sembra, quindi, che possiamo dividere i ragionamenti in due tipi radicalmente differenti, che noi possiamo riconoscere nelle parole di Peirce come (1) ‘esplicativi, analitici, o deduttivi’ e (2) ‘amplificativi, sintetici, oppure (in senso lato) Induttivi’.1 I ragionamenti del secondo tipo sono da un importante punto di vista molto più vicini ai ricordi e alle percezioni rispetto ai ragionamenti deduttivi. Possiamo considerare la percezione, la memoria e l’induzione come tre fondamentali mezzi per acquisire la conoscenza; la deduzione invece è soltanto un metodo di organizzare la nostra conoscenza e di eliminare incongruenze o contraddizioni.

La logica deve quindi rientrare decisamente in due parti: (escludendo la logica analitica, la teoria dei termini e delle proposizioni) abbiamo la logica minore, che è la logica della coerenza, o logica formale, e la logica maggiore, che è la logica della scoperta, o la logica induttiva.

Quello che abbiamo ora da osservare è che questa distinzione in alcun modo coincide con la distinzione tra certezza e convinzioni parziali; abbiamo visto che esiste una teoria della coerenza nella convinzione parziale non meno della coerenza nella convinzione certe, sebbene per vari motivi la prima non è così importante come la seconda. La teoria della probabilità è in realtà una generalizzazione della logica formale; ma nel processo di generalizzazione uno degli aspetti più importanti della logica formale è demolito.  Se p e  Schermata 2013-08-23 alle 22.32.01       non sono coerenti in modo che q segue logicamente da p, che p implica q è ciò che è chiamato da Wittgenstein una ‘tautologia’ e può essere considerato come un caso degenere di una proposizione vera che non comporti il concetto di coerenza. Questo ci permette di considerare (non del tutto correttamente) la logica formale inclusa la matematica come una scienza oggettiva costituita da proposizioni necessariamente oggettive. Questo ci fornisce non soltanto la ἀνάγκη λέγειν, che se noi affermiamo p siamo costretti dalla coerenza affermare anche q, ma anche l’ ἀνάγκη εἶναι, che se p è vero, così deve essere q. Ma quando estendiamo la logica formale per includere le convinzioni parziali tale interpretazione oggettiva esplicita è perduta;  se crediamo pq nella misura di 1/3 e p  Schermata 2013-08-23 alle 22.32.01   nella misura di 1/3 siamo costretti per coerenza a credere anche  Schermata 2013-11-24 alle 21.04.13     nella misura di 1/3.  Questo è ἀνάγκη λέγειν, ma non possiamo dire che se pq è vero per 1/3 e p Schermata 2013-08-23 alle 22.32.01     vero per 1/3, anche Schermata 2013-11-24 alle 21.04.13  deve essere vero per 1/3, perché questa asserzione sarebbe puro non senso. Lì non ci sarebbe corrispondenza ἀνάγκη εἶναι. Quindi, a differenza del calcolo di coerenza della convinzione piena, il calcolo dell’oggettiva parziale convinzione non può essere immediatamente interpretato come un corpo di oggettiva tautologia.

Questo è però possibile in modo indiretto; abbiamo visto all’inizio di questo saggio che il calcolo delle probabilità potrebbe essere interpretato in termini di rapporti di classi; ora abbiamo scoperto che può anche essere interpretato come un calcolo di coerente convinzione parziale. E’ naturale, quindi, che dovremmo aspettarci una qualche intima connessione tra queste due interpretazioni, una spiegazione della possibilità di applicare lo stesso calcolo matematico a due insiemi diversi di tali fenomeni. Nè c’è una spiegazione difficile da trovare, ci sono molte connessioni tra convinzioni parziali e frequenze. Per esempio, le frequenze sperimentate spesso portano a corrispondenti convinzioni parziali, e convinzioni parziali portano all’aspettativa di frequenze corrispondenti in accordo al teorema di Bernoulli. Ma nessuna di queste è esattamente la correlazione che vorremmo; una convinzione parziale non può in generale essere collegata univocamente con qualsiasi frequenza effettiva, perché la correlazione viene sempre realizzata prendendo la proposizione in questione come un caso di una funzione proposizionale. Quale funzione proposizionale abbiamo scelto è in qualche misura arbitraria e la frequenza corrispondente varierà notevolmente con la nostra scelta. Le pretese di alcuni esponenti della teoria della frequenza che la convinzione parziale significa piena convinzione in una proposizione sulla frequenza non può essere sostenuta.

1 C.S. Peirce Chance Love and Logic, p.92

Ma abbiamo scoperto che l’idea stessa della convinzione parziale comporta il riferimento ad una ipotetica o ideale frequenza; supponendo che il bene abbia la proprietà additiva, credere con il grado m/n è un tipo di convinzione che conduce alla azione che vorremmo fosse la migliore se ripetuta n volte in m delle quali la proposizione sia vera; o potremmo dire più brevemente che questo è il tipo di convinzione più appropriata ad un certo numero di occasioni ipotetiche altrimenti identiche nella proporzione m/n per cui la proposizione in questione è vera. E’ questa correlazione tra convinzione parziale e frequenza che ci permette di utilizzare il calcolo delle frequenze, come un calcolo di coerente convinzione parziale. E in un certo senso possiamo dire che le due interpretazioni sono gli aspetti oggettivi e soggettivi dello stesso significato recondito, così come la logica formale può essere interpretata oggettivamente come un corpo di tautologie e soggettivamente come le leggi del pensiero coerente.

Noi, credo, scopriremo che questo punto di vista del calcolo delle probabilità rimuove varie difficoltà che finora sono stati trovate sconcertanti. In primo luogo ci fornisce una evidente giustificazione degli assiomi di calcolo, che in un sistema come quello di Keynes è totalmente mancante. Perché ora si vede facilmente che se le convinzioni parziali sono coerenti obbediranno a questi assiomi, ma è assolutamente oscuro perché le misteriose relazioni logiche di Keynes dovrebbero obbedire a questi assiomi. 1 Dovremmo essere così stranamente ignoranti degli esempi di queste relazioni, e così stranamente perspicaci circa le loro leggi generali.

In secondo luogo, possiamo fare a meno del Principio di Indifferenza; noi non lo consideriamo appartenente alla logica formale nel dire che sarebbe una previsione di una persona l’estrarre una palla bianca o nera da un’urna; le sue aspettative iniziali potrebbero essere entro i limiti della coerenza qualcosa che egli preferisce; tutto quello che dobbiamo sottolineare è che se ha certe aspettative egli è tenuto per coerenza ad averne certe altre. Questo è semplicemente prendere la probabilità sullo stesso piano della normale logica formale, che non critica le premesse, ma dichiara semplicemente che alcune conclusioni sono le sole coerenti con esse. Essere in grado portare fuori dalla logica formale il Principio di Indifferenza è un grande vantaggio; perché è abbastanza evidentemente impossibile stabilire condizioni puramente logiche per la sua validità, come viene tentato da Keynes. Non voglio discutere la questione in dettaglio, perché porta alla pedanteria e a distinzioni arbitrarie che potrebbero essere discusse per sempre. Ma chi cerca di decidere con i metodi di Keynes quali siano le alternative adeguate a considerare l’equiprobabile nella meccanica delle molecole, ad esempio in Gibbs nello spazio-fase, sarà presto convinto che sia una questione di fisica piuttosto che di logica pura. Usando la formula di moltiplicazione, come viene usato nella probabilità inversa, possiamo in base alla teoria di Keynes ridurre tutte le probabilità a quozienti di probabilità a priori; ed è quindi con riguardo a questi ultimi che il principio di indifferenza è di primaria importanza, ma qui il problema non è ovviamente un problema di logica formale. Come possiamo semplicemente su basi logiche suddividere lo spettro in bande equiprobabili?

Nel sistema di Keynes appare come se gli assiomi principali – le leggi di addizione e moltiplicazione – non siano altro che definizioni. Si tratta semplicemente di un errore logico; le sue definizioni sono formalmente errate, a meno che vengano assunti i corrispondenti assiomi. Così la sua definizione di moltiplicazione presuppone la legge che se la probabilità di a dato bh è uguale a quella di c dato dh, e la probabilità di b dato h è uguale a quella di d dato k, allora la probabilità di ab dato h e di cd dato k saranno uguali.

Una terza difficoltà che viene eliminata dalla nostra teoria è quella che è presente nella teoria di Keynes nel caso seguente. Credo di percepire o ricordare qualcosa ma non sono sicuro; questo sembrerebbe darmi qualche motivo di credere, contrariamente alla teoria di Keynes,per cui il grado di convinzione che dovrei avere essendo razionale per me  è quello dato dal rapporto di probabilità tra la proposizione in questione e le cose che so per certe. Egli non può giustificare una probabile convinzione fondata non su ragionamenti ma su diretta sperimentazione. A nostro avviso non ci sarebbe niente di contrario alla logica formale, in una tale convinzione; se questo sia ragionevole dipenderà da quello che ho chiamato la grande logica che sarà il soggetto del prossimo capitolo; vedremo che non c’è nessuna obiezione a tale possibilità, con la quale il metodo di Keynes di giustificare la probabile convinzione esclusivamente attraverso relazione di conoscenza certa non è assolutamente in grado di sostenere.

(5) LA LOGICA DELLA VERITÁ

La validità della distinzione tra la logica di coerenza e la logica della verità è stata spesso contestata; è stato sostenuto da un lato che la coerenza logica è solo una specie di coerenza basata sui fatti; che se la convinzione in p non è coerente con una in q, significa semplicemente che p e q non sono entrambe vere, e che questo è un fatto necessario o fatto logico. Personalmente, ritengo che questa difficoltà può essere soddisfatta dalla teoria di Wittgenstein sulla tautologia, secondo la quale se una convinzione in p è incompatibile con quella di q che p e q non sono entrambe vere non è un fatto, ma una tautologia. Ma io non mi propongo di discutere di questo problema ulteriormente qui.

Dall’altra parte si sostiene che la logica formale o la logica di coerenza sia  l’insieme della logica e la logica induttiva  sia o un nonsenso o una parte delle scienze naturali. Questa asserzione, che suppongo che sia stata fatta da da Wittgenstein, sento più difficile da controbattere. Ma io credo che sarebbe un peccato, a causa del rispetto verso l’autorità, rinunciare a provare a dire qualcosa di utile sull’induzione.

Dobbiamo quindi tornare indietro alla concezione generale della logica come scienza del pensiero razionale. Noi troviamo che le parti più generalmente accettate della logica, vale a dire, la logica formale, la matematica e il calcolo delle probabilità, riguardano tutte semplicemente il garantire che le nostre convinzioni non siano auto-contraddittorie. Abbiamo posto davanti a noi stessi i criteri di coerenza e costruito queste elaborate regole per garantirne l’osservanza. Ma ovviamente questo non basta; vogliamo che le nostre convinzioni siano coerenti non solo l’una con l’altra ma anche con i fatti 1: né è ancora chiaro che la coerenza sia sempre vantaggiosa; ma potrebbe essere meglio essere a volte nel giusto che mai nel giusto. Né quando vogliamo essere coerenti siamo sempre in grado di esserlo: ci sono proposizioni matematiche la cui verità o falsità non può ancora essere decisa. Eppure si può umanamente parlando di avere diritto di prendere in considerazione un certo grado di convinzione in quelle per motivi induttivi o su altre basi: una logica che si propone di giustificare un tale grado di convinzione deve essere disposta in realtà  ad andare contro la logica formale; perché a una verità formale logica si può assegnare solo una convinzione di grado 1. Si potrebbe dimostrare nel sistema di Keynes che la sua probabilità è pari a 1 in qualsiasi prova. Questo punto mi sembra di dimostrare in modo particolarmente evidente che la logica umana o la logica della verità, che dice agli uomini come dovrebbero pensare, non è solo indipendente, ma a volte in realtà incompatibile con la logica formale.

1 Cfr.. Kant: ‘Denn obgleich eine Erkenntnis der logischen Form völlig gemäss sein möchte, dass ist sich selbst nicht widerspräche, so kann sie doch noch immer dem Gegenstande widersprechen.’ Kritik der reinen Vernunft, ‘, Prima Edizione p. 59. Infatti, sebbene la conoscenza della forma logica sia del tutto coerente cioè non contraria a sé, può tuttavia essere in disaccordo con l’oggetto ‘. Critica della ragion pura.

Nonostante questo quasi tutto il pensiero filosofico sulla logica umana e in particolare sull’induzione ha cercato di ridurlo in qualche modo alla logica formale. Non si suppone questo, se non da pochissimi, che la coerenza da sé stessa conduca alla verità; ma che alla coerenza con l’osservazione e la memoria spesso è attribuito questo potere.

Dal momento che un’osservazione ha cambiato (almeno in grado) la mia opinione sul fatto osservato, alcuni dei miei gradi di convinzione dopo l’osservazione sono necessariamente non coerenti con quelli che avevo prima. Dobbiamo quindi spiegare come esattamente l’osservazione potrebbe modificare i miei gradi di convinzione; ovviamente se p è il fatto osservato, il mio grado di convinzione in q dopo l’osservazione dovrebbe essere uguale al mio grado di convinzione in q dato p di prima, o dalla legge di moltiplicazione, al quoziente del mio grado di convinzione in pq per il mio grado di convinzione in p . Quando i miei gradi di convinzione cambiano in questo modo possiamo dire che essi sono stati modificati coerentemente con la mia osservazione.

Usando questa definizione, o nel sistema di Keynes semplicemente utilizzando la legge di moltiplicazione, possiamo prendere i miei attuali gradi di convinzione, e considerando la totalità delle mie osservazioni, scoprire da quali gradi iniziali di convinzione i miei attuali gradi di convinzione sarebbero sorti da questo processo di coerente modifica. I miei livelli attuali di convinzione possono quindi essere considerati logicamente giustificati se i corrispondenti gradi iniziali di convinzione sono logicamente giustificati. Ma il chiedere quali gradi iniziali di convinzione siamo giustificati, o nel sistema di Keynes quali sono le probabilità assolute a priori, mi sembra un problema senza senso; e anche se avesse un significato non vedo come potrebbe essere risolto.

Se abbiamo effettivamente applicato questo processo per un essere umano, scoperto, vale a dire, su quali probabilità a priori le sue opinioni attuali dovrebbero essere basate, dovremmo ovviamente trovarle tra quelle determinate da selezione naturale, con una generale tendenza a dare una maggiore probabilità alle alternative più semplici. Ma, come ho detto , non riesco a vedere quale potrebbe essere lo scopo di chiedersi se questi gradi di convinzione siano logicamente giustificati.

Ovviamente la cosa migliore sarebbe quella di sapere con certezza in anticipo che cosa sia vero e cosa falso, e quindi se un qualsiasi sistema di convinzioni iniziali dovesse ricevere l’approvazione del filosofo dovrebbe essere questo. Ma evidentemente questo non sarebbe accettato dai pensatori della scuola che sto criticando. Un’altra alternativa è quella di ripartire le probabilità iniziali sul sistema puramente formale esposto da Wittgenstein, ma come questo non fornisce alcuna giustificazione per l’induzione non può darci la logica umana che stiamo cercando.

Dobbiamo quindi cercare di avere un’idea di una logica umana che non deve tentare di essere riducibile alla logica formale. La logica, possiamo essere d’accordo, non riguarda ciò che gli uomini credono davvero, ma quello che dovrebbero credere, o quello che sarebbe ragionevole credere. Cosa significa allora, dobbiamo chiederci, dire che è ragionevole per un uomo avere questo o quel grado di convinzione in una proposizione? Prendiamo in considerazione le possibili alternative.

In primo luogo, questo significa a volte qualcosa di spiegabile in termini di logica formale: possiamo abbandonare questa possibilità per i motivi già spiegati. In secondo luogo, a volte significa semplicemente che essendo io al suo posto (e non ad esempio ubriaco) avrei avuto un tale grado di convinzione. In terzo luogo, a volte significa che se la sua mente lavora secondo certe regole, che possiamo approssimativamente chiamare ‘metodo scientifico’, avrebbe avuto un tale grado di convinzione. Ma in quarto luogo non è necessario sostenere nessuna di queste cose; perché gli uomini non hanno sempre creduto nel metodo scientifico, e proprio come noi domandiamo’ Ma io sono necessariamente ragionevole‘, possiamo anche chiedere ‘Ma è lo scienziato necessariamente ragionevole?’ In quest’ultimo significato mi sembra che possiamo identificare una ragionevole opinione con l’opinione di una persona ideale in circostanze analoghe. Quale, invece, sarebbe l’opinione di questa persona ideale ? Come è stato già osservato, il più alto ideale sarebbe sempre che avrebbe una opinione vera e sarebbe certo di ciò; ma questo ideale è più adatto a Dio che all’uomo.1

Dobbiamo dunque considerare la mente umana e ciò che è il massimo che possiamo chiedere ad essa. 2 La mente umana lavora essenzialmente in base a regole generali o abitudini; un processo mentale che non procede secondo qualche regola sarebbe semplicemente una sequenza casuale di idee; ogni volta che si deduce A da B lo facciamo in virtù di una qualche relazione tra di loro. Possiamo quindi affermare il problema dell’ideale come ” Quali abitudini in senso generale sarebbero le migliori che avesse la mente umana? ” Questo è un grande e indeterminato problema che difficilmente potrebbe essere risolto a meno che le possibilità fossero dapprima state limitate da una concezione abbastanza precisa della natura umana. Potremmo immaginare alcune abitudini molto utili diverse da quelle possedute da tutti gli uomini. [ Va precisato che io uso l’abitudine con il significato più ampio possibile per significare semplicemente regola o legge di comportamento, tra cui l’istinto: non voglio distinguere regole o abitudini acquisiti in senso stretto dalle regole innate o istinti, ma mi propongo di chiamarle tutte ugualmente abitudini.] Una analisi del tutto generale della mente umana è quindi destinata ad essere vaga e futile, ma qualcosa di utile si può dire se limitiamo l’argomento nel modo seguente.

Supponiamo di avere l’abitudine di formare un’opinione in un certo modo; ad esempio l’abitudine di derivare dall’opinione che un fungo è giallo l’opinione che sia velenoso. Allora possiamo accettare il fatto che la persona ha un’abitudine di questo genere, e chiedere semplicemente quale grado di parere che il fungo è velenoso sarebbe meglio per lui prendere in considerazione quando lo vede; cioè ammettendo che pensa sempre nello stesso modo su tutti i funghi gialli, possiamo chiedere quale sia il grado di fiducia migliore che lui dovrebbe avere che quei funghi siano velenosi. E la risposta è che sarà in generale migliore per il suo grado di convinzione che un fungo giallo è velenoso sia pari alla quota di funghi gialli che sono in realtà velenosi. (Ciò deriva dal significato del grado di convinzione.) Questa conclusione è necessariamente vaga per quanto riguarda l’area spazio-temporale dei funghi, che include, ma difficilmente più vaga della domanda a cui risponde. (Cfr. densità in un punto di gas composto da molecole.)

1[ Una precedente stesura della materia del paragrafo in qualche modo migliore. – F.P.R. Che cosa si intende dicendo che un certo grado di convinzione è ragionevole ? Primo e spesso che è quello che prenderei in considerazione se avessi i pareri della persona in questione al momento, ma erano diversi da come sono adesso, ad esempio, non ubriachi. Ma a volte andiamo oltre e chiediamo: ‘ Sono ragionevole?’ Questo può significare, mi comporto conformemente a determinate norme, enumerabili che noi chiamiamo metodo scientifico, e che stimiamo a causa del valore di chi lo pratica ed il successo che raggiunge. In questo senso essere ragionevoli significa pensare come uno scienziato, o essere guidato solo da raziocinio e induzione o qualcosa del genere (vale a dire mezzi ragionevoli di riflessione). In terzo luogo, possiamo andare alla radice del perché ammiriamo lo scienziato e analizziamo non un parere particolare primario, ma un abitudine mentale che conduce o meno alla scoperta della verità o prende in considerazione quei gradi di convinzione che sarebbero più utili. (Per includere le abitudini al dubbio o alla convinzione parziale). Allora possiamo considerare un parere secondo l’ abitudine che lo ha prodotto. Questo è chiaramente ragionevole, perché tutto dipende da questa abitudine; ma non sarebbe ragionevole ottenere la giusta conclusione di un sillogismo ricordando in modo impreciso che si lascia fuori un termine che è comune ad entrambe le premesse. Usiamo ragionevole nel senso 1 quando parliamo di un argomento di uno scienziato questo non mi sembra ragionevole; nel senso 2 quando confrontiamo la ragione e superstizione o istinto; nel senso 3 quando si valuta il valore dei nuovi metodi di pensiero come la divinazione.]

2 Quello che segue fino alla fine della sezione è quasi interamente basato sugli scritti di C.S. Peirce . [Soprattutto le sue ” illustrazioni della Logica della scienza “, Popular Science Monthly 1877 e 1878 , ristampato in Chance Love and Logic ( 1923).]

Mettiamola in un altro modo: ogni volta che faccio una deduzione, la faccio in base a qualche regola o abitudine. Un’inferenza non è completamente data quando ci è data la premessa e la conclusione; deve essere data anche la relazione fra esse in virtù della quale viene realizzata la deduzione. La mente funziona per leggi generali; quindi se deduce q da p , questo sarà generalmente perché q è un caso di una funzione φx e p il corrispondente caso di una funzione ψx tale che la mente sempre dedurrà φx da ψx . Quando quindi non analizziamo le opinioni, ma i processi attraverso cui sono nate, la regola della deduzione determina per noi un intervallo a cui la teoria della frequenza può essere applicata. La regola di deduzione può essere ristretta, come quando vedendo un fulmine mi aspetto il tuono, o larga , come quando si considerano 99 casi di una generalizzazione che ho osservato per essere vera concludo che il centesimo anche è vero. Nel primo caso, l’abitudine che determina il processo è ‘ Dopo il lampo si aspetta il tuono ‘; il grado di affidamento che sarebbe il migliore per questa abitudine da esprimere è pari al rapporto tra i casi di lampi che siano effettivamente seguiti da tuoni. Nel secondo caso l’abitudine è quella più generale di inferire da 99 casi osservati un certo tipo di generalizzazione che il centesimo è anche vero; il grado di convinzione che sarebbe meglio per questa abitudine da esprimere è uguale alla proporzione di tutti i casi dei 99 esempi di una generalizzazione che è vera, in cui anche il centesimo è vero.

Così dato un unico parere , possiamo solo lodarlo o biasimarlo sulla base della verità o della falsità: data l’abitudine ad una certa forma, possiamo lodarlo o biasimarlo di conseguenza a seconda che il grado di convinzione che produce sia vicino o lontano dalla reale proporzione in cui l’abitudine conduce alla verità. Possiamo allora lodare o biasimare opinioni in forma derivata dalla nostra lode o biasimo delle abitudini che li producono.

Questa relazione può essere applicata non solo alle abitudini di deduzione, ma anche alle abitudini di osservazione e alla memoria; quando abbiamo una certa sensazione in relazione con un’immagine pensiamo che l’ immagine rappresenti qualcosa che in realtà è successo a noi, ma non possiamo esserne sicuri; il grado di diretta fiducia nella nostra memoria varia. Se ci chiediamo qual è il miglior grado di fiducia che possiamo riporre in una sicura specifica sensazione di memoria, la risposta deve dipendere da quanto spesso, quando questo sentimento si verifica l’evento a cui l’immagine si collega si è veramente verificato.

Tra le abitudini della mente umana una posizione di particolare importanza è occupata dall’induzione. Fin dai tempi di Hume molto è stato scritto circa la giustificazione dell’inferenza induttiva. Hume ha mostrato che non poteva essere ridotta a inferenza deduttiva o giustificata dalla logica formale. Nel modo in cui si sviluppa la sua dimostrazione mi sembra definitiva; e il suggerimento di Keynes che può essere aggirata per quanto riguarda l’induzione come una forma di inferenza probabile, non può a mio avviso essere accettato. Ma supporre che la situazione che ne deriva sia uno scandalo per la filosofia è, a mio avviso, un errore.

Siamo tutti convinti per ragionamenti induttivi, e la nostra convinzione è ragionevole, perché il mondo è così costituito che gli argomenti induttivi conducono tutto sommato a pareri veri. Non siamo, pertanto, in grado di avere fiducia nell’induzione, né se potessimo aiutarla non vedremmo alcuna ragione per cui dovremmo, perché noi crediamo che sia un processo affidabile. E vero che che se qualcuno non ha l’abitudine nell’induzione, non potremmo dimostrargli che sbaglia; ma non c’è nulla di particolare in questo. Se un uomo dubita della propria memoria o della sua percezione non possiamo dimostrargli che sono affidabili; il chiedere per questo una cosa che lo provi è piangere per la luna, e lo stesso vale per l’induzione. E’ una delle principali fonti di conoscenza così come lo è la memoria: nessuno considera uno scandalo per la filosofia che non c’è la prova che il mondo non sia cominciato due minuti fa e che tutti i nostri ricordi non siano illusori.

Siamo tutti d’accordo che un uomo che non ha fatto induzioni sarebbe non razionale: il problema è solo ciò che questo significa. A mio parere ciò non significa che l’uomo peccherebbe contro la logica formale o la probabilità formale; ma che non avrebbe acquisito un’abitudine molto utile, senza la quale starebbe molto peggio, nel senso di essere molto meno probabile 1 che abbia opinioni vere.

Si tratta di una sorta di pragmatismo: noi giudichiamo le abitudini mentali a seconda se funzionano, cioè se le opinioni che inducono siano per la maggior parte vere, o più spesso vere di quelle che differenti abitudini indurrebbero.

L’induzione è una abitudine utile, e ad adottarla è ragionevole. Tutto ciò che la filosofia può fare è di analizzarla, determinare il grado della sua utilità, e trovare da quali caratteristiche della natura, questa dipenda. Un mezzo indispensabile per indagare questi problemi è l’induzione stessa, senza la quale saremmo impotenti. In questa circolarità non si si trova nessun circolo vizioso. E’ solo attraverso la memoria che possiamo determinare il grado di accuratezza della memoria; perché se facciamo esperimenti per determinare questo effetto, essi saranno inutili se non li ricordassimo.

Si consideri, alla luce della discussione precedente quale tipo di soggetto sia induttivo o di logica umana – la logica della verità. La sua attività è quella di prendere in considerazione i metodi di pensare, e scoprire che misura di fiducia si debba riporre in questi, vale a dire in quale proporzione di esperienze essi conducono alla verità. In questa analisi essa può solo essere distinta dalle scienze naturali per la maggiore generalità dei suoi problemi. Si deve considerare la relativa validità dei diversi tipi di procedure scientifiche, come ad esempio la ricerca di una legge causale con i Metodi Mill, ed i moderni metodi matematici come il ragionamento a priori usato nella scoperta della Teoria della Relatività. Il progetto corretto di tale soggetto si può trovare in Mill 1, io non intendo i dettagli dei suoi Metodi o anche l’uso della Legge di Causalità. Ma il suo modo di trattare l’argomento come un corpo di induzioni riguardante induzioni, la Legge di Causalità che governa meno le leggi essendo essa stessa dimostrata per induzione per semplice enumerazione. I diversi metodi scientifici che possono essere utilizzati sono in ultima istanza valutati per induzione per semplice enumerazione; abbiamo scelto la più semplice legge che si adatta ai fatti, ma se non scopriamo che leggi così ottenute si adattano anche a fatti differenti da quelli per cui erano state realizzate per adattarsi, dobbiamo scartare questa procedura per qualche altra.

1 ‘probabile’ qui significa semplicemente che io non sono sicuro di questo, ma ho solo un certo grado di convinzione in esso.

 Cfr.. anche la relazione sulle ‘General rules’ nel capitolo ‘Of Unphilosophical Probability’ nel Trattato di Hume.

Facts and Propositions – Da The Foundation of Mathematics di Frank P. Ramsey

7 Giu

Schermata 2013-12-04 alle 16.16.05Propongo la mia traduzione della sesta parte delle opere pubblicate di Frank Plumpton Ramsey  raccolte da R. B. Braithwaite sotto il titolo The Foundation of Mathematics.

Questa sezione è particolarmente importante perché tratta il tema del “significato” e delle relazioni proposizionali condividendo larga parte delle teorie di Wittgenstein come espresse nel Tractatus.

VI

Fatti e Proposizioni (1927)

Il problema che mi propongo di trattare è l’analisi logica di ciò che può essere chiamato attraverso qualsiasi dei termini giudizio, convinzione, o asserzione. Supponiamo che io stia in questo momento esprimendo il giudizio che Cesare è stato assassinato: allora è naturale distinguere in questo fatto, da un lato o la mia mente, o il mio attuale stato mentale, o le parole o le immagini nella mia mente, che chiameremo il fattore mentale o i fattori mentali, e dall’altro lato o Cesare, o l’omicidio di Cesare, o Cesare e l’omicidio, o la proposizione che Cesare fu assassinato, o il fatto che Cesare è stato assassinato, che chiameremo il fattore oggettivo o fattori oggettivi; e il supporre che il fatto su cui sto esprimendo un giudizio che Cesare è stato assassinato si accorda con il possedere qualche relazione o le relazioni tra questi fattori mentali e i fattori oggettivi. Le domande che sorgono sono per quanto riguarda la natura dei due gruppi di fattori e dei rapporti tra di loro, essendo la distinzione fondamentale tra questi elementi difficilmente discutibile.

Cominciamo con il fattore oggettivo o fattori oggettivi; il punto di vista più semplice è che ci sia uno solo di tali fattori, una proposizione, che può essere vera o falsa, essendo la verità e la falsità attributi non analizzabili. Questo era un tempo il punto di vista di Russell, e nel suo saggio ” Sulla natura della Verità e del Falso ” 1 , spiega le ragioni che lo hanno spinto ad abbandonarla. Questi erano, in sintesi, l’impossibilità di credere nell’esistenza di certi oggetti come ‘ che Cesare è morto nel suo letto ‘, che potrebbero essere descritti come falsità oggettive, e la misteriosa natura della differenza, in questa teoria , tra verità e falsità. Ha quindi concluso, a mio parere giustamente, che un giudizio non ha un singolo oggetto, ma è una relazione multipla della mente o di fattori mentali su molti oggetti, quelli, cioè, che chiameremmo ordinariamente costituenti della proposizione valutata.

1 In Philosophical Essays, 1910.

Vi è, tuttavia, un modo alternativo di ritenere che una giudizio abbia un unico oggetto, che sarebbe bene prendere in considerazione prima di passare oltre. Nel saggio summenzionato Russell afferma che una percezione, che a differenza di un giudizio egli considera infallibile, ha un unico oggetto, ad esempio, l’ oggetto complesso ‘ coltello-a-sinistra-del-libro ‘. Questo oggetto complesso può, credo, essere identificato con quello che molte persone (e Russell ora) avrebbe chiamato il fatto che il coltello è a sinistra del libro; potremmo, per esempio, dire che abbiamo percepito questo fatto. E proprio come se noi prendiamo una qualsiasi proposizione vera come quella di Cesare che non è morto nel suo letto, possiamo formare una corrispondente frase che inizia con ‘il fatto che ‘ e ​​parlare del fatto che non è morto nel suo letto, così Russell suppose che ad ogni proposizione vera non corrispondesse un oggetto complesso.

Russell, quindi, riteneva che l’oggetto di una percezione era un fatto, ma che nel caso di un giudizio la possibilità di errore rendesse questo punto di vista insostenibile, dal momento che l’oggetto di un giudizio che Cesare è morto nel suo letto non poteva essere il fatto che è morto nel suo letto, dal momento che non esisteva un tale fatto. È tuttavia evidente che tale difficoltà sull’errore potrebbe essere rimossa postulando per il caso di un giudizio due relazioni differenti tra i fattori mentali e il fatto, una che si presenta per i giudizi veri, l’altra in quelli falsi. Così, un giudizio che Cesare fu assassinato e un giudizio che Cesare non fu assassinato avrebbero lo stesso oggetto, il fatto che Cesare è stato assassinato, ma differiscono per quanto riguarda i rapporti tra il fattore mentale e questo oggetto. Così, in The Analysis of Mind 1 Russell parla di convinzione sia come verso sia contro i fatti. Mi sembra, tuttavia, che tale punto di vista  o di giudizio o di percezione sarebbe inadeguato per un motivo che, se valido, è di grande importanza. Prendiamo per semplicità il caso della percezione e, assumendo per amor di discussione che sia infallibile, consideriamo se ‘ Egli percepisce che il coltello è a sinistra del libro’ può davvero asserire una relazione biunivoca tra una persona e un fatto. Supponiamo che io che faccio l’affermazione non possa io stesso vedere il coltello e il libro, che il coltello sia realmente alla destra del libro, ma che, attraverso qualche errore suppongo che si trovi a sinistra e che egli percepisca essere a sinistra, in modo che io affermo erroneamente ‘ Egli percepisce che il coltello è a sinistra del libro’. Allora la mia affermazione, anche se falsa, è significativa, e ha lo stesso significato che avrebbe se fosse vera; questo significato non può quindi essere che ci sia una relazione biunivoca tra la persona e qualcosa (un fatto) di cui ‘ che il coltello è a fianco del libro ‘ è il nome, perché non esiste nulla di simile. La situazione è la stessa come con le descrizioni; ‘ Il re di Francia è saggio ‘ non è un nonsenso, e così ‘ il re di Francia ‘, come Russell ha dimostrato, non è un nome, ma un simbolo incompleto, e lo stesso deve essere vero del ‘ re d’Italia ‘. 2 Così anche ‘ che il coltello è a sinistra del libro ‘ se sia vero o falso, non può essere il nome di un fatto.

1 p. 272. Va osservato che, in The Analysis of Mind una ‘ convinzione ‘ è ciò che chiamiamo un fattore mentale, non l’intero complesso di fattori mentali e delle relazioni e dei fattori oggettivi.

2 N.d.t. Occorre tenere presente che nel 1927 l’Italia aveva un re.

Ma, si potrebbe chiedere, perché non dovrebbe essere una descrizione di un fatto? Se dico ‘ Egli percepisce che il coltello è a sinistra del libro ‘, intendo che lui percepisce un fatto che non viene nominato, ma descritto come di un certo tipo, e la difficoltà scompare quando la mia affermazione viene analizzata secondo la teoria di Russell delle descrizioni. Allo stesso modo, si dirà, ‘ la morte di Cesare ‘ è una descrizione di un evento, e ‘ il fatto che Cesare è morto ‘ è solo un’espressione alternativa per ‘ la morte di Cesare ‘.

Una tale obiezione è plausibile, ma non è, a mio parere, valida.

La verità è che una frase come ‘ la morte di Cesare ‘ può essere utilizzata in due modi diversi; di solito, la usiamo come la descrizione di un evento, e potremmo dire che ‘ la morte di Cesare ‘ e ‘ l’assassinio di Cesare ‘ siano due diverse descrizioni dello stesso evento. Ma possiamo anche usare ‘ la morte di Cesare ‘ in un contesto come ‘ Era consapevole della morte di Cesare ‘ che significa ‘ Egli era consapevole del fatto che Cesare era morto ‘: qui (e questo è il tipo di caso che si verifica nella discussione sulla cognizione), non possiamo considerare ‘ la morte di Cesare ‘, come la descrizione di un evento; se così fosse, l’intera proposizione sarebbe ‘ C’è un evento E di un certo tipo tale che egli è consapevole di E ‘, e che sarebbe ancora vero se avessimo sostituito un’altra descrizione dello stesso evento, ad esempio, ‘ l’assassinio di Cesare ‘. Cioè, se la sua consapevolezza ha per oggetto un evento descritto da ‘ la morte di Cesare ‘, allora , se è a conoscenza della morte di Cesare, deve anche essere a conoscenza dell’assassinio di Cesare, perché sono identici. Ma, in realtà, poteva benissimo essere consapevole del fatto che Cesare era morto senza sapere che era stato ucciso, in modo che la sua consapevolezza deve avere per oggetto non solo un evento, ma un evento e anche una qualità.

Il collegamento tra l’evento che è stato la morte di Cesare e il fatto che Cesare è morto è, a mio parere, questo: ‘ che Cesare è morto ‘ è davvero una proposizione esistenziale, asserendo l’esistenza di un evento di un certo tipo, somigliando così a ‘ l’Italia ha un Re ‘, che afferma l’esistenza di un uomo di un certo tipo. L’evento, che è di questo tipo si chiama la morte di Cesare, e non sarebbe più confuso con il fatto che Cesare è morto di quanto che il Re d’ Italia sia confuso con il fatto che l’Italia ha un re.

Abbiamo visto, quindi, che una frase che inizia ‘ il fatto che ‘ non non è un nome, ma anche che non è una descrizione; è , dunque, né un nome né una descrizione di qualsiasi componente effettivo di una proposizione, e così una proposizione ‘ il fatto che aRb ‘ deve essere analizzata nella (1) proposizione aRb, (2) qualche ulteriore proposizione intorno ad a, R, b, e altri oggetti; e un’analisi della cognizione in termini di relazioni con i fatti non può essere accettato come definitiva. Siamo spinti, quindi, alla conclusione di Russell che un giudizio 1 non ha un oggetto, ma molti oggetti, a cui il fattore mentale è correlato in modo multiplo; ma il lasciare le cose come stanno, come ha fatto, non può essere considerato soddisfacente. Non c’è ragione di supporre la relazione multipla semplice; essa può, per esempio, derivare dalla combinazione di relazioni duali tra parti del fattore mentale e gli oggetti separati; ed è auspicabile che dovremmo trovare qualcosa di più su questa, e come varia quando viene variata la forma di proposizione assunta. Allo stesso modo, una teoria delle descrizioni che si soddisfi nell’osservare che ‘ Il re di Francia è saggio ‘ potrebbe essere considerata come affermare un possibile rapporto multiplo tra la regalità, la Francia, e la saggezza, sarebbe miseramente inferiore alla teoria di Russell, che spiega esattamente di che relazione si tratta.

1 E , a nostro avviso, è il caso di qualsiasi altra forma di conoscenza o opinione che qualcosa…

Ma prima di procedere ulteriormente con l’ analisi del giudizio, è necessario dire qualcosa su verità e falsità, al fine di dimostrare che non c’è davvero alcun problema distinto di verità, ma solo una confusione linguistica. Verità e falsità sono attribuiti principalmente alle proposizioni. La proposizione a cui sono attribuite può essere sia esplicitamente data o descritta. Supponiamo dapprima che sia esplicitamente data; quindi è evidente che ‘ E’ vero che Cesare è stato assassinato ‘ significa non più di che Cesare è stato assassinato, e ‘ È falso che Cesare è stato assassinato ‘ significa che Cesare non è stato assassinato. Queste sono frasi che a volte usiamo per enfasi o per ragioni stilistiche, o per indicare la posizione occupata dalla asserzione nel nostro ragionamento. Così anche noi possiamo dire ‘ E’ un fatto che è stato assassinato ‘o’ che sia stato ucciso è contrario alla realtà ‘. Nel secondo caso in cui la proposizione è descritta e non data esplicitamente abbiamo forse più di un problema, perché noi otteniamo dichiarazioni da cui non possiamo nel linguaggio ordinario eliminare la parola ‘ vero ‘ e ‘ falso ‘. Quindi se dico ‘ Lui ha sempre ragione ‘, voglio dire che le proposizioni che egli afferma sono sempre vere, e non ci sembra che esista un modo di esprimere questo senza usare la parola ‘ vero ‘. Ma supponiamo che lo abbiamo messo così ‘ per ogni p, se egli afferma p, p è vera ‘, allora vediamo che la funzione proposizionale p è vera, è semplicemente la stessa p, come ad esempio il suo valore ‘Cesare fu assassinato è vero ‘ è lo stesso di ‘ Cesare è stato assassinato ‘. Abbiamo in inglese da aggiungere ‘ è vero ‘ per dare alla frase un verbo, dimenticando che ‘p’ contiene già un (variabile) verbo. Questo può forse essere reso più chiaro supponendo per un momento che sia in esame una sola forma di proposizione, diciamo la forma relazionale aRb; allora ‘ Lui ha sempre ragione ‘ potrebbe essere espressa da ‘ Per tutti gli a, R, b, se egli afferma aRb , allora aRb ‘, a cui ‘ è vero ‘ sarebbe un’aggiunta ovviamente superflua. Quando tutte le forme di proposizione sono incluse l’analisi è più complicata ma non sostanzialmente differente; ed è evidente che il problema non è tanto la natura del vero e del falso, ma sulla natura del giudizio o affermazione, perché ciò che è difficile analizzare nella formulazione di cui sopra è ‘ Egli afferma aRb ‘.

E’, forse, anche immediatamente evidente che se abbiamo analizzato il giudizio noi abbiamo risolto il problema della verità; perché prendendo il fattore mentale in un giudizio (che spesso viene esso stesso chiamato giudizio), la verità o la falsità di questo dipende solo da quale proposizione viene giudicata, e ciò che dobbiamo spiegare è il significato nel dire che il giudizio è un giudizio che a ha R con b, cioè è vero se aRb, falso nel caso contrario. Possiamo, se vogliamo, dire che è vero se esiste un fatto corrispondente che a ha R con b, ma questo non è essenzialmente un’analisi, ma una perifrasi, perché ‘ Il fatto che a  ha R con b esiste ‘ non è diverso da ‘ a ha R con b ‘.

Al fine di andare avanti, dobbiamo ora considerare i fattori mentali in una convinzione. La loro natura dipenderà dal significato in cui stiamo usando il termine ambiguo convinzione: è, ad esempio, possibile dire che un pollo crede che un certo tipo di bruco sia velenoso, e intendere con questo semplicemente che si astiene dal mangiare tali bruchi a causa di spiacevoli esperienze ad essi collegate. I fattori mentali in una tale convinzione sarebbero parti del comportamento del pollo, che sono in qualche modo legati a fattori oggettivi, vale a dire il tipo di bruco e la velenosità. Un’analisi esatta di questa relazione sarebbe molto difficile, ma potrebbe anche essere meglio considerato che in relazione a questo tipo di convinzione il punto di vista pragmatico è corretto, cioè che la relazione tra il comportamento del pollo e i fattori oggettivi era che le azioni erano tali da risultare utili se, e solo se, i bruchi erano in realtà velenosi. Pertanto, qualsiasi insieme di azioni per cui l’utilità p è una condizione necessaria e sufficiente potrebbe essere chiamato una convinzione che p, e così sarebbe vera se p, cioè se fosse utile 1.

1 E ‘utile pensare che aRb vorrebbe dire che è utile per fare le cose che sono utili se, e solo se, aRb; che è evidentemente equivalente a aRb.

Ma senza voler svalutare l’importanza di questo tipo di convinzione, non è quello che voglio discutere qui. Io preferisco trattare con quelle convinzioni che si esprimono in parole, o anche in immagini o con altri simboli, consapevolmente affermate o negate; perché queste convinzioni, a mio avviso, sono il soggetto più adatto per una critica logica.

Io assumo essere le parole i fattori mentali di una tale convinzione, pronunciate ad alta voce o tra sé e sé o semplicemente immaginate, collegate tra loro e accompagnate da una sensazione o sensazione di credere o sensazione di non credere, a essa collegata in un modo che non mi propongo di discutere. 2 Io suppongo per semplicità che il pensatore di cui ci stiamo occupando usa un linguaggio sistematico, senza irregolarità e con una notazione logica esatta come quella dei Principia Matematica. I segni principali in tale linguaggio possono essere suddivisi in nomi logici, costanti logiche e variabili. Cominciamo con nomi, ogni nome rappresenta un oggetto, che significa che esiste una relazione biunivoca tra questi. Evidentemente il nome, il significato, la relazione, e l’oggetto possono essere davvero tutti complessi, in modo che il fatto che il nome significa l’oggetto non è in definitiva nella forma relazionale biunivoca ma molto più complicata.1 Tuttavia, proprio come nello studio degli scacchi non si guadagna nulla nel discutere sugli atomi di cui i pezzi degli scacchi sono costituiti, così nello studio della logica non si guadagna nulla entrando nell’analisi fondamentale dei nomi e degli oggetti che li rappresentano. Questi costituiscono gli elementi delle convinzioni del pensatore in base alle quali le varie relazioni logiche fra una convinzione e l’altra possono essere definite, mentre la loro costituzione interna è irrilevante.

2 Parlo in tutto e per tutto come se le differenze tra convinzione, non convinzione, e mera considerazione si trovino in presenza o assenza di ‘ sensazioni ‘; ma qualsiasi altra parola può essere sostituita a ‘ sensazione ‘ che il lettore preferisce, ad esempio, ‘ specifica qualità ‘ o ‘ atto di affermazione ‘ e ‘ atto di negazione ‘.

1 Questo è più evidente nel caso di nomi, che generalmente consistono di lettere, in modo che la loro complessità è evidente.

Per mezzo dei nomi solo chi pensa può formare quelle che potremmo chiamare frasi atomiche, che dal nostro punto di vista formale, non offrono un problema molto serio. Se a , R , e b sono oggetti che sono semplici in relazione al suo linguaggio, cioè delle tipologie di esempi di cui egli possiede nomi, egli crederà che aRb avendo i nomi per a, R, e b connessi nella sua mente e accompagnati da un sentimento di convinzione. Questa affermazione, tuttavia, è troppo semplice, dal momento che i nomi devono essere uniti in un modo appropriato ad aRb piuttosto che a bRa; ciò può essere spiegato dicendo che il nome di R non è la parola ‘ R ‘, ma la relazione che costruiamo tra ‘a’ e ‘b’ scrivendo ‘ aRb ‘. Il senso in cui questa relazione unisce ‘a’ e ‘ b ‘, quindi determina se si tratta di una convinzione che aRb o che bRa. Ci sono varie altre difficoltà dello stesso tipo, ma mi propongono di passare ai problemi più interessanti che sorgono quando consideriamo le più complicate convinzioni che richiedono per la loro espressione non solo i nomi, ma anche costanti logiche, così che dobbiamo spiegare la modalità di significato di parole come ‘non’ e ‘o’ .

Una possibile spiegazione 1 è che esse, o alcune di esse, ad esempio ‘non’ e ‘e’ in base a cui gli altri possono essere definiti, sono nomi di relazioni, in modo che le frasi in cui si presentano sono simili a quelle atomiche, tranne che per le relazioni che essi affermano che sono logiche invece che materiali. Da questo punto di vista ogni proposizione è definitivamente affermativa, affermando una semplice relazione tra termini semplici, o un semplice qualità di un termine semplice. Così, ‘Questo è non – rosso ‘ afferma un rapporto della negazione tra questo e il rosso, e ‘Questo non è non – rosso’ un altra relazione di negazione tra questo, il rosso e la prima relazione della negazione.

1 Cfr., in particolare , J.A. Chadwick, ” Logical Constants “. Mind, 1927.

Questo punto di vista richiede un atteggiamento così diverso dalla logica da parte mia che è difficile per me trovare una base comune da cui partire per discuterne. Ci sono, tuttavia, una o due cose che vorrei dire nella critica: in primo luogo, che trovo molto insoddisfacente che sia lasciato senza alcuna spiegazione di logica formale, tranne che si tratta di una raccolta di ‘fatti necessari’. La conclusione di una inferenza formale deve, mi pare, essere in un certo senso contenuta nelle premesse e non qualcosa di nuovo; io non posso credere che da un fatto, ad esempio, che una cosa è rossa, possa essere possibile dedurre un numero infinito di fatti diversi, ad esempio che questo non è non rosso, e che è sia insieme rosso e non non – rosso. Questi, dovrei dire, sono semplicemente lo stesso fatto espressi in altre parole; né è inevitabile che ci dovrebbero essere tutti questi modi diversi di dire la stessa cosa. Potremmo, per esempio, esprimere la negazione non inserendo una parola ‘ non ‘, ma scrivendo ciò che neghiamo a testa in giù. Tale simbolismo è solo scomodo perché non siamo abituati a percepire una simmetria complicata attorno ad un asse orizzontale, ma se l’avessimo adottata ci saremmo liberati del ridondante ‘non – non ‘, con il risultato che negare la frase ‘p’ per due volte sarebbe semplicemente la frase ‘p’ stessa.

Mi sembra, quindi, che ‘ non ‘ non può essere un nome (perché, se lo fosse, ‘ non – non – p ‘ dovrebbe essere circa l’oggetto non e così diverso nel significato da ‘ p ‘), ma deve funzionare in un modo radicalmente diverso. Ne consegue che dobbiamo permettere alle negazioni e alle  disgiunzioni di essere in ultima analisi diverse dalle affermazioni positive e non solo le affermazioni di relazioni diverse ma ugualmente positive. Dobbiamo, quindi, abbandonare l’idea che ogni proposizione asserisce una relazione tra termini, un’idea che sembra difficile da scartare come la più vecchia che una proposizione asserisce sempre un predicato di un soggetto.

Supponiamo che il nostro pensatore stia prendendo in considerazione una sola frase atomica, e che il progresso della sua meditazione conduca sia al suo crederla o non crederla. Questo può essere supposto che consista inizialmente in due diverse sensazioni legate alla frase atomica, e in tale relazione mutuamente esclusiva; la differenza tra affermazione e negazione è quindi formato da una differenza di sensazione e non nell’assenza o nella presenza di una parola come ‘ non ‘. Tale parola, tuttavia, sarà abbastanza indispensabile ai fini della comunicazione, essendo la convinzione nella frase atomica comunicata pronunciandola ad alta voce, il non credere con il pronunciare insieme a questa la parola ‘ non ‘. Con una sorta di associazione questa parola entrerà a far parte del linguaggio interno del nostro pensatore, e invece di sentire la non convinzione verso ‘ p ‘ lui a volte sentirà la convinzione verso ‘ non – p’.

Se questo accade, possiamo dire che non credere ‘p’ e credere ‘ non -p ‘ sono eventi equivalenti, ma il determinare cosa si intende con questo ‘ equivalente ‘ è, a mio avviso, la difficoltà centrale del soggetto. La difficoltà esiste in qualsiasi teoria, ma è particolarmente importante nella mia, che sostiene che il significato di ‘non’ non consiste in una relazione di significato di un oggetto, ma in questa equivalenza tra non credere ‘p’ e credere ‘ non – p ‘ .

Mi sembra che l’equivalenza tra credere ‘ non – p ‘ e non credere ‘ p ‘ deve essere definita in termini di causalità, avendo i due esempi in comune molte delle loro cause e molti dei loro effetti. Ci sarebbero molte occasioni in cui ci dovremmo aspettarci che l’una o l’altra possa prodursi, ma non so quale, e qualsiasi avvenga dovremmo aspettarci lo stesso tipo di comportamento di conseguenza. L’essere equivalenti, potremmo dire, è l’avere in comune alcune proprietà causali, che vorrei poter definire con maggiore precisione. Chiaramente non sono affatto semplici; non c’è un’azione uniforme che nel credere ‘p’ si verificherà sempre. Potrebbe non indurre a nessuna azione del tutto, tranne che in circostanze particolari, in modo che le sue proprietà causali esclusivamente esprimeranno quegli effetti che risultino quando sono soddisfatte alcune altre condizioni. E, ancora, solo alcuni tipi di cause ed effetti devono essere ammessi; per esempio , non siamo interessati ai fattori che determinano, ed i risultati determinati da, il ritmo delle parole.

Sentire convinzione verso le parole ‘ non – p ‘ e sentire incredulità verso le parole ‘ p’ hanno allora in comune alcune proprietà causali. Mi propongo di esprimere questo fatto dicendo che i due casi esprimono lo stesso atteggiamento, l’atteggiamento di non credere p o credere non – p. D’altra parte, sentire la convinzione verso ‘p ‘ ha differenti proprietà causali, e quindi esprime un atteggiamento diverso, l’atteggiamento di credere p. E’ evidente che l’importanza delle convinzioni e non convincimento risiede non nella loro natura intrinseca, ma nelle loro proprietà causali, cioè le loro cause e soprattutto i loro effetti. E perché dovrei avere una sensazione di convinzione verso i nomi ‘a’ , ‘ R ‘ e ‘b’ , quando aRb, e di non credere quando non – aRb, tranne perché gli effetti di queste sensazioni sono spesso più soddisfacenti di quelli alternativi a questi.

Se allora io dico di qualcuno di cui non conosco lingua ‘Egli crede che non – aRb ‘, voglio dire che sta accadendo nella sua mente una certa combinazione di una sensazione e parole tali da esprimere l’atteggiamento di credere non – aRb, cioè ha alcune proprietà causali, che possono in questo semplice caso 1, essere specificati come quelle che appartengono alla combinazione di una sensazione di incredulità e i nomi per a, R, e b, o, nel caso di chi utilizza la lingua inglese, alla combinazione di una sensazione di convinzione, per i nomi a, R , e b , e per un numero dispari di ‘ non’. Oltre a questo , si può dire che le proprietà causali sono collegate con a, R, e b in modo tale che le uniche cose che le possono avere devono essere composte dai nomi di a, R, e b. (Questa è la dottrina che il significato di una frase deve risultare dal significato delle parole in essa contenute).

1 Nei casi più complicati trattati più avanti una descrizione simile mi sembra impossibile se non con riferimento ad una lingua particolare. Ci sono modi in cui questo può apparentemente essere fatto, ma penso che siano illusori.

Quando abbiamo a che fare con una sola proposizione atomica, siamo abituati ad abbandonare la teoria della probabilità degli atteggiamenti intermedi della convinzione parziale, e a considerare solo gli estremi della piena convinzione e piena non convinzione. Ma quando il nostro pensatore si occupa di diverse proposizioni atomiche insieme, la questione è più complicata, perché abbiamo a che fare non solo con atteggiamenti completamente definiti, come credere p e non credere q, ma anche con atteggiamenti relativamente indefiniti, come credere che sia vero p o q, senza sapere quale. Tale atteggiamento può, tuttavia, essere definito in termini di possibilità di verità delle proposizioni atomiche, con le quali concorda e non concorda. Quindi , se abbiamo n proposizioni atomiche, per quanto riguarda la loro verità e falsità ci saranno 2n possibilità reciprocamente esclusive, e un possibile atteggiamento è determinato dall’assumere un qualsiasi insieme di queste e dire che è una di questa serie che è, in effetti, verificata, non una delle rimanenti. Così, il credere p o q è l’esprimere un accordo con le possibilità p vera e q vero, p falso e q vero, p vero e q falso, e il disaccordo con la restante possibilità p falso e q falso. Il dire che la sensazione di convinzione verso una frase esprime un atteggiamento del genere equivale a dire che ha alcune proprietà causali che variano con l’atteggiamento, ovvero quali possibilità vengono eliminate e quali, per così dire, vengono invece lasciate. Molto approssimativamente il pensatore agirà in disaccordo con le possibilità respinte, ma non so come spiegare questo con precisione.

In qualsiasi linguaggio comune un simile atteggiamento può essere espresso con una sensazione di convinzione nei confronti di una frase complessa costituita dalle frasi atomiche per mezzo di congiunzioni logiche; quale atteggiamento esso sia, dipenderebbe non dalla sensazione ma dalla forma della frase. Possiamo quindi dire in modo ellittico che la frase esprime l’atteggiamento, e che il significato di una frase è un accordo e un disaccordo con tali e tali altre possibilità di verità, intendendo con ciò che uno che afferma o crede in una frase così è d’accordo e in disaccordo.

Nella maggior parte delle notazioni logiche il significato della frase è determinata da segni di operazione logici che si presentano in essa, come ‘ non ‘ e ‘e’. Questo ha significato nel modo seguente: ‘ non – p ‘ , sia che ‘p’ sia una proposizione atomica o no, esprime un accordo con le possibilità con cui ‘p’ esprime un disaccordo e viceversa. ‘ p e q ‘ esprimono accordo con una certa possibilità che sia ‘ p ‘ sia ‘ q ‘ esprimano accordo tra loro, e disaccordo con tutte le altre. Con queste regole il significato di ogni frase costruito da frasi atomiche per mezzo di ‘non’ e ‘e’ è completamente determinato, il significato di ‘ non ‘ essendo così definito  come una legge che determina l’atteggiamento espresso da ‘ non-p ‘ nei termini di quello espresso da ‘ p ‘.

Questo potrebbe, naturalmente, essere utilizzato solo come definizione di ‘ non ‘ in un simbolismo basato direttamente sulle possibilità di verità. Così nella notazione spiegata a pagina 95 del  Tractatus logico-philosophicus  di Wittgenstein, potremmo definire ‘ non-P ‘ come il simbolo ottenuto scambiando la T e gli spazi nell’ultima colonna di ‘ p ‘. Di solito, però, usiamo sempre un diverso tipo di simbolismo in cui ‘ non ‘ è un segno primitivo che non può essere definito senza circolarità; ma anche in questo simbolismo possiamo chiederci come ‘ ” nicht ” che significa non’ sarebbe da analizzare, ed è questo problema a cui le osservazioni di cui sopra sono destinate a rispondere. Nel nostro simbolismo ordinario le possibilità di verità sono più convenientemente espresse come congiunzioni di proposizioni atomiche e le loro negazioni, e qualsiasi proposizione sarà esprimibile come una disgiunzione delle possibilità di verità con cui concorda.

Se applichiamo le operazioni logiche alle frasi atomiche in modo indiscriminato, noi a volte otterremo frasi composite che non esprimono nessun atteggiamento di convinzione. Così ‘ p o non-p ‘ esclude qualsiasi possibilità e quindi non esprime del tutto un atteggiamento di convinzione. Essa deve essere considerata non una frase significativa, ma una sorta di caso 1 degenere, e viene chiamato da Wittgenstein una tautologia. Essa può essere aggiunta a qualsiasi altra frase senza alterarne il significato, perché ‘ q : p o non -p ‘ concorda proprio con le stesse possibilità di ‘ q ‘. Le proposizioni di logica formale e di matematica pura sono in questo senso tautologie, e questo è ciò che si intende nel chiamarle ‘verità necessarie’.

1 Nel significato matematico in cui due linee o due punti formano una conica degenere.

Allo stesso modo ‘ p e non-p ‘ esclude ogni possibilità e non esprime alcun atteggiamento possibile: si chiama una contraddizione.

Nei termini di questi concetti possiamo spiegare cosa si intende per logica, matematica, o inferenza formale o implicazione. L’inferenza da ‘ p’ a ‘ q ‘ è formalmente garantita quando ‘ se p , allora q ‘ è una tautologia, o quando le possibilità di verità con cui ‘ p ‘ si accorda sono contenute tra quelle con quelle con cui ‘ q ‘ si accorda. Quando questo accade, è sempre possibile esprimere ‘ p ‘ nella forma ‘ q ed r ‘, in modo che la conclusione ‘ q ‘ può dirsi già contenuta nella premessa.

Prima di passare alla questione delle proposizioni generali devo dire qualcosa su una difficoltà evidente. Abbiamo supposto in precedenza che i significati dei nomi nella lingua del nostro pensatore potrebbero essere effettivamente complessi, così che quello che era per lui una frase atomica potrebbe apparire dopo la traduzione in un linguaggio più raffinato come niente del genere. Se così fosse potrebbe accadere che alcune delle combinazioni di vero e falso delle sue proposizioni atomiche sarebbero realmente contraddittorie. Questo è stato in realtà supposto essere essere il caso di ‘ blu’ e ‘rosso’, e Leibniz e Wittgenstein hanno considerato ‘ Questo è sia blu sia rosso ‘ come auto-contraddittoria, essendo la contraddizione nascosta da un difetto di analisi. Qualunque cosa si possa pensare di questa ipotesi, mi sembra che la logica formale non si occupa di questo, ma presuppone che tutte le possibilità di verità delle frasi atomiche siano realmente possibili, o almeno le considera come essere così. Nessuno potrebbe dire che l’inferenza da ‘ Questo è rosso ‘ a ‘ Questo non è blu ‘ fosse formalmente garantita come il sillogismo. Se posso tornare all’analogia degli scacchi, questa ipotesi potrebbe forse essere paragonata al presupposto che gli scacchi non sono magnetizzati così fortemente da rendere alcune posizioni sulla scacchiera meccanicamente impossibili, così che abbiamo bisogno di prendere in considerazione solo le restrizioni imposte dalle regole del gioco, e possiamo prescindere da tutte le altre che potrebbero presumibilmente derivare dalla costituzione fisica degli uomini.

Finora ci siamo dovuti confinare alle proposizioni atomiche e a quelle da esse derivate da un numero finito di operazioni vere, e a meno che la nostra considerazione sia irrimediabilmente incompleta dobbiamo ora dire qualcosa sulle proposizioni generali, come quelle che sono espresse in inglese tramite le parole ‘ tutti ‘ e ‘ qualche ‘, o nella notazione dei Principia Mathematica da variabili apparenti. Circa queste adotto il punto di vista di Wittgenstein 1 che ‘ Per tutte le x , ƒx ‘ è da considerarsi equivalente al prodotto logico di tutti i valori di ‘ ƒx ‘ , vale a dire alle combinazioni ƒx1 e ƒx2 e ƒx3 e … , e che ‘ C’è una x tale che ƒx ‘ è analogamente la loro somma logica. In relazione a tali simboli si possono distinguere in primo luogo l’elemento di generalità che entra nella questione nello specificare i termini veri, che non sono, come prima, enumerati, ma determinati come tutti i valori di una certa funzione proposizionale; e in secondo luogo l’elemento funzione verità  elemento che è il prodotto logico nel primo caso e la somma logica nel secondo.

Che cosa è originale circa le proposizioni generali è semplicemente la specificazione dei termini veri mediante una funzione proposizionale invece di una enumerazione. Così proposizioni generali, proprio come quelle molecolari, esprimono accordo e disaccordo con le possibilità di verità di proposizioni atomiche, ma lo fanno in un modo diverso e più complicato. Sentire convinzione verso ‘ Per tutte le x , ƒx ‘ ha alcune proprietà causali che noi chiamiamo il suo esprimere accordo solo con la possibilità che tutti i valori di ƒx siano veri. Per un simbolo l’avere queste proprietà casuali non è necessario, come era prima, di contenere i nomi di tutti gli oggetti coinvolti combinati in frasi atomiche adeguate, ma per una legge particolare della psicologia è sufficiente per esso di essere costruito nel modo precedentemente descritto mediante una funzione proposizionale.

1 Ed anche, a quanto pare, di Johnson. Vedere il suo Logic Part II, p.59.

Come prima, questo non deve essere considerato come un tentativo di definire ‘ tutti’ e ‘ qualche ‘, ma solo come un contributo all’analisi di ‘ Credo che tutti (o alcuni) ‘.

Questo punto di vista di proposizioni generali ha il grande vantaggio che ci permette di estendere ad esse la relazione di Wittgenstein di inferenza logica, e il suo punto di vista che la logica formale consiste di tautologie. E’ anche l’unico punto di vista che spiega come ‘ ƒa ‘può essere dedotta da ‘ Per tutte le x , ƒx ‘ e ‘ C’è un x tale che ƒx ‘da’ ƒa ‘. La teoria alternativa che ‘ C’è un x tale che ƒx ‘ dovrebbe essere considerata come una proposizione atomica della forma ‘ F ( f) ‘ ( f si applica) lascia questo del tutto oscuro; non fornisce alcuna connessione comprensibile fra a di  essere rossa e al rosso di avere un’applicazione, ma abbandonando ogni speranza di spiegare questa relazione si accontenta di etichettarla come ‘ necessaria ‘.

Tuttavia , mi aspetto che l’obiezione sarà fatta sulle seguenti linee: in primo luogo, si dirà che a non può entrare nel significato di ‘ Per tutte le x , ƒx ‘ , perché posso affermare questo senza aver mai sentito parlare di a. A questo io rispondo che questa è una parte essenziale dell’utilità della generalità del simbolismo, che ci permette di fare affermazioni su cose di cui non abbiamo mai sentito parlare e quindi non hanno nomi. Oltre che a è coinvolta nel significato di ‘ Per tutte le x , ƒx’ può essere osservato dal fatto che se io dico ‘ per tutte le x , ƒx , ‘ e qualcuno risponde ‘ non – ƒa’, allora, anche se non avevo prima sentito parlare di a, egli senza dubbio mi starebbe contraddicendo.

La seconda obiezione che mi si potrebbe fare è più seria; si potrebbe dire che questo punto di vista di proposizioni generali rende ciò che le cose ci sono nel mondo non, come in realtà è, un fatto contingente, ma qualcosa di presupposto dalla logica o nella migliore delle ipotesi da una proposizione della logica. Così ciò potrebbe indurre che, anche se potessi avere un elenco di qualsiasi cosa nel mondo ‘a’, ‘b’ , … ‘ z ‘ , ‘ Per tutte le x , ƒx ‘ non sarebbe comunque equivalente a ‘ ƒa.ƒb … ƒz ‘ , ma piuttosto sarebbero equivalenti a ‘ ƒa.ƒb …. ƒz e a, b … z ‘ sarebbero tutte le cose. Per questo Wittgenstein replicherebbe che ‘ a, b ​​… z sono tutto ciò che non ha senso, e non potrebbe essere scritto del tutto nel simbolismo migliorato di identità. Una corretta discussione di questa risposta coinvolgerebbe tutta la sua filosofia, ed è, quindi, fuori questione qui; tutto ciò che mi propongo di fare è di replicare con un tu quoque! L’obiezione evidentemente non avrebbe forza se ‘ a, b ​​… z sono tutte le cose ‘ fossero, come con adatte definizioni penso che possano essere resi, una tautologia; perché allora questo potrebbe essere lasciato fuori senza alterarne il significato. Gli obiettori quindi sosterranno che non è una tautologia, o nella loro terminologia non una proposizione necessaria; e questo essi presumibilmente riterrebbero in merito a qualsiasi proposizione del genere, cioè diranno che asserire di un insieme di cose che sono o non sono tutto non può essere né necessariamente vera né necessariamente falsa. Ma essi, io ritengo, ammetteranno che l’identità numerica e la differenza sono relazioni necessarie, che ‘ C’è un x tale che ƒx ‘ deriva necessariamente da ‘ ƒa ‘, e che tutto ciò che segue necessariamente da una verità necessaria è di per sé necessario. Se è così, la loro posizione non può essere sostenuta; per ipotesi a, b , c sono infatti non tutto, ma che ci sia un’altra cosa d. Allora questo d non è identico ad a, b, o c è un fatto necessario; quindi è necessario che vi sia un x tale che x non è identico ad a, b , o c , o che a, b , c non sono gli unici oggetti nel mondo. Si tratta quindi, anche dal punto di vista di chi obietta, di una verità necessaria e non di una verità contingente.

In conclusione, devo sottolineare il mio debito verso Wittgenstein, dal quale è derivato il mio punto di vista della logica. Tutto ciò che ho detto è dovuto a lui, tranne le parti che hanno una tendenza 1 pragmatica, che mi sembrano necessarie al fine di colmare una lacuna nel suo sistema. Ma qualunque cosa possa essere pensata di queste mie aggiunte, e comunque questa lacuna debba essere riempita, la sua concezione della logica formale mi sembra indubbiamente un enorme avanzamento di quelle di qualsiasi pensatore precedente.

Il mio pragmatismo deriva da Russell; ed è, ovviamente, molto vago e non sviluppato. L’essenza del pragmatismo assumo essere questo, che il significato di una frase deve essere definita con riferimento alle azioni alla cui asserzione condurrebbero, o, più vagamente ancora, dalle sue possibili cause ed effetti. Di questo mi sento certo, ma nulla di più preciso .

1 E l’idea che la nozione di proposizione atomica può essere relativa ad una lingua.

Universals – Note on the preceding paper da The Foundation of Mathematics di Frank Ramsey

3 Giu

Schermata 2013-11-30 alle 15.07.43Propongo la mia traduzione della quarta e quinta parte delle opere pubblicate di Frank Plumpton Ramsey  raccolte da R. B. Braithwaite sotto il titolo The Foundation of Mathematics.

Questa sezione, anche se apparentemente sembra una esercitazione di logica astratta presenta la soluzione di problemi logici e filosofici molto complessi. Si osserva in particolare l’influenza di Ludwig Wittgenstein nell’elaborazione di questi concetti che potrebbero essere da molti scambiati per “roba da matematici puri” mentre influiscono molto profondamente nel modo di concepire e interpretare a realtà.

IV

Universali (1925 )

Lo scopo di questo lavoro è quello di valutare se esista una divisione fondamentale di oggetti in due classi, particolari e universali. La questione è stata discussa da Russell in un articolo riportato negli Atti dell’Aristotelian Society del 1911. La sua conclusione che la distinzione era definitiva è stata basata su due comuni argomenti, diretti contro i due ovvii metodi di abolire la distinzione ritenendo o che gli universali sono insiemi di particolari, o che i particolari sono insiemi delle loro qualità. Questi ragionamenti, appaiono perfetti corretti fino a che sono accettabili, comunque non mi sembra che risolvano l’intera questione. Il primo, che appare di nuovo in The Problems of Philosophy, mostra come in opposizione ai nominalisti che una certa proposizione come ‘ Questo dato sensoriale è bianco ‘ deve avere come unico costituente, qualcosa come la bianchezza o la somiglianza, che non è della stesso tipo logico del dato sensoriale stesso. Il secondo argomento , anche brevemente esposto in The Nature of Existence di McTaggart, dimostra che un uomo non può essere identificato con la somma delle sue qualità.

Ma sebbene un uomo non possa essere una delle sue qualità, non c’è ragione per cui non dovrebbe essere una qualità di qualcos’altro.

In realtà gli oggetti materiali sono descritti da Whitehead come ‘ veri aggettivi Aristotelici ‘; così che non possiamo considerare che questi due argomenti interpretino la distinzione tra particolare e universale al sicuro contro ogni critica .

Che cosa è allora, mi propongo di chiedere, la differenza tra particolare e universale? Che cosa possiamo dire di una cosa che non sarà vera anche per un’altra? Se seguiamo Russell dovremo indagare su tre tipi di distinzione, psicologiche, fisiche e logiche. In primo luogo abbiamo la differenza tra una percezione e un concetto, gli oggetti di due diversi tipi di atti mentali; ma è improbabile che questa sia una distinzione di qualche fondamentale importanza, dal momento che una differenza tra due atti mentali non può corrispondere a qualche differenza in quale che sia dei loro oggetti. Poi abbiamo diverse distinzioni tra gli oggetti in base alle loro relazioni con lo spazio e il tempo; per esempio, alcuni oggetti possono essere solo in un luogo in un certo tempo; altri, come il colore rosso, possono esserlo in molti. Anche in questo caso, nonostante l’ importanza del tema , non credo che possiamo aver raggiunto il nocciolo della questione. Perché quando, per esempio , Whitehead dice che un tavolo è un aggettivo, e Johnson che si tratta di un sostantivo, non stanno discutendo in quanti posti il tavolo può essere in una sola volta, ma sulla sua natura logica. E così è con le distinzioni logiche di cui principalmente la nostra indagine deve occuparsi.

Secondo Russell la classe degli universali è la somma della classe dei predicati e della classe delle relazioni; ma questa dottrina è stato negata da Stout .1 Ma a Stout è stato già sufficientemente risposto. 2 Quindi io discuterò solo la comune opinione a cui Russell aderisce.

1 “The Nature of Universals and Propositions”, Proc. . British Academy , 1921-1922 ( ristampato in Studies in Philosophy and Psychology, 1930) .

2 Cfr. il simposio tra GE Moore , G.F. Stout & G. Dawes Hicks Aristotelian Society Supplementary Volume III, 1923.

Secondo lui i termini sono suddivisi in singolari o particolari, qualità e relazioni, qualità e relazioni che sono riuniti insieme come universali; e talvolta le qualità sono anche incluse tra le relazioni come relazioni ad un termine per distinguerle dalle relazioni a due, tre o più termini.

Johnson divide anche i termini in sostantivi e aggettivi, comprendendo le relazioni come aggettivi transitivi; ed egli considera la distinzione fra sostantivo e aggettivo per spiegare quelle tra particolare e universale. Ma tra queste autorità, che sono così lontanamente d’accordo, c’è ancora una differenza importante. Johnson sostiene che sebbene la natura di un sostantivo sia tale che può in una proposizione solo avere funzione di soggetto e mai di predicato, tuttavia un aggettivo può avere funzione sia come predicato sia come soggetto di cui un aggettivo secondario può essere predicato. Ad esempio , in ‘ la mancanza di puntualità è un difetto ‘ il soggetto è esso stesso un aggettivo – la qualità della mancanza di puntualità . Vi è quindi una mancanza di simmetria tra sostantivi e aggettivi, perché mentre un predicato deve essere un aggettivo, un soggetto può essere sia un sostantivo sia un aggettivo, e dobbiamo definire un sostantivo come un termine che può essere solo un soggetto, mai una predicato .

Russell, invece, nelle sue lezioni sull’Atomismo Logico 1 ha negato questo. Egli dice che in un aggettivo c’è qualcosa di incompleto, qualche suggerimento della forma di una proposizione; così che il simbolo dell’aggettivo non  può mai stare da solo o essere il soggetto di una proposizione, ma deve essere completato in una proposizione in cui è predicato. Così, egli dice, il simbolo appropriato per l’essere rosso non è la parola ‘rosso’, ma la funzione ‘ x è rosso ‘, e il rosso può entrare in una proposizione solo attraverso i valori di questa funzione. Quindi Russell direbbe ‘ la mancanza di puntualità è un difetto ‘ in realtà intenderebbe qualcosa come ‘ Per tutte le x, se x è non è puntuale, x è riprovevole ‘; e l’aggettivo mancanza di puntualità non è il soggetto della proposizione ma solo entra in esso come il predicato di quelle delle sue parti che sono nella forma ‘ x non è puntuale’ . Questa dottrina è la base del nuovo lavoro nella seconda edizione dei Principia Mathematica .

1 The  Monist 1918 e il 1919.

Nessuna di queste teorie sembra del tutto soddisfacente, anche se nessuna delle due possa essere confutata. Il punto di vista di Russell, infatti, comporta difficoltà nel rapporto con le nostre relazioni cognitive con gli universali, per cui era stato respinto nella prima edizione dei Principia, ma queste difficoltà mi sembrano, come ora a Russell, affatto insormontabili. Ma non potevo discuterne qui senza intraprendere innumerevoli questioni irrilevanti rispetto ai punti principali che desidero esaminare.

Né l’una né l’altra teoria, quindi, può essere confutata, ma ad entrambe possono essere sollevate obiezioni che sembrerebbero avere una certa forza. Per esempio, Russell insiste che in una relazione tra due termini non può esserci un terzo termine che si intrometta tra questi, perché allora non sarebbe affatto una relazione, e il solo elemento realmente relazionale consisterebbe nelle relazioni tra questo nuovo termine e i due termini originali. Questo è il tipo di considerazione da cui Bradley deduce il suo regresso all’infinito, che Russell a quanto pare ora approva.

Johnson potrebbe rispondere che per lui l’elemento di connessione o strutturale non è la relazione, ma i legami caratterizzanti e di accoppiamento; ma questi legami restano gli oggetti più misteriosi. Si potrebbe anche obiettare che Johnson non costruisce particolari e universali abbastanza diversi, o prende in considerazione l’incompletezza peculiare degli aggettivi che appare nella possibilità di anteporre ad essi l’ ausiliare ‘essere ‘; ‘essere rosso’, ‘ essere un uomo ‘ non sembrano cose reali come una sedia e un tappeto .

Contro Russell potrebbe essere domandato come possono esistere oggetti come i suoi universali, che contengono la forma di una proposizione e così sono incompleti. In un certo senso, si potrebbe insistere, tutti gli oggetti sono incompleti; e non possono verificarsi nei fatti, salvo in combinazione con altri oggetti, e contengono le forme di proposizioni di cui sono componenti. In che modo gli universali lo fanno più di qualsiasi altra cosa?

Evidentemente, tuttavia, nessuno di questi argomenti sono davvero decisivi, e la posizione è estremamente insoddisfacente per chiunque con una reale curiosità in merito a una questione così fondamentale .

In questi casi è una massima euristica che la verità non si trova in una dei due punti di vista controversi ma in qualche terza possibilità su cui non si è ancora riflettuto, che possiamo scoprire solo rifiutando qualcosa assunto come ovvio da entrambi i contendenti.

Entrambe le teorie controverse fanno un presupposto importante che, a mio avviso, deve essere solo esaminato per dubitarne.

Esse assumono una fondamentale antitesi tra soggetto e predicato, che se una proposizione è composta da due termini accoppiati, questi due termini devono funzionare in diversi modi, uno come soggetto, l’altro come predicato. Così in ‘ Socrate è saggio ‘ , Socrate è il soggetto, saggio il predicato. Ma supponiamo che noi si giri la proposizione e si dica ‘ la Sapienza è una caratteristica di Socrate’, allora la saggezza, l’ex predicato, è ora il soggetto . Ora mi sembra chiaro come qualsiasi cosa può esserlo nella filosofia che le due frasi ” Socrate è saggio ‘, ‘ La saggezza è una caratteristica di Socrate ‘ affermano lo stesso fatto ed esprimono la stessa proposizione. Esse non sono, ovviamente, la stessa frase, ma hanno lo stesso significato, come due frasi in due lingue diverse possono avere lo stesso significato. Quale frase usiamo è una questione sia di stile letterario, o del punto di vista da cui ci avviciniamo al fatto. Se il centro del nostro interesse è di Socrate diciamo ‘ Socrate è saggio ‘, se stiamo discutendo sulla saggezza possiamo dire ‘ La saggezza è una caratteristica di Socrate ‘, ma qualsiasi cosa diciamo intendiamo la stessa cosa. Ora, di una di queste frasi ‘ Socrate ‘ è il soggetto , nell’altra ‘ la saggezza ‘; e così di quale delle due è soggetto, e di quale predicato, dipende da quella particolare frase che usiamo per esprimere la nostra proposizione, e non ha nulla a che fare con la natura logica di Socrate o della saggezza, ma è del tutto una questione per i grammatici. Allo stesso modo, con un linguaggio sufficientemente elastico qualsiasi proposizione può essere espressa in modo che uno qualsiasi dei suoi termini sia il soggetto. Quindi non vi è alcuna distinzione essenziale tra il soggetto di una proposizione e il suo predicato, e nessuna classificazione fondamentale di oggetti può essere basata su una tale distinzione.

Non pretendo che l’argomento di cui sopra sia immediatamente conclusivo; quello che io sostengo è che si gettano dubbi su tutte le basi della distinzione tra particolare e universale come si deduce da quella tra soggetto e predicato, e che la questione richiede un nuovo esame. Si tratta di un punto che è stato spesso presentato da Russell che i filosofi sono molto suscettibili di essere tratti in inganno dalla costruzione soggetto-predicato della nostra lingua. Essi hanno supposto che tutte le proposizioni devono essere di forma soggetto-predicato, e così sono stati indotti a negare l’esistenza di relazioni. Io sostengo che quasi tutti i filosofi, tra cui lo stesso Russell, sono stati ingannati dalla lingua in un modo di molto di più vasta portata di questo; che tutta la teoria dei particolari e universali è dovuta allo scambiare per una caratteristica fondamentale della realtà ciò che è solamente una caratteristica del linguaggio.

Dunque, esaminiamo da vicino questa distinzione tra soggetto e predicato, e per semplicità seguiamo Johnson e includiamo le relazioni tra predicati e i loro termini tra i soggetti. La prima domanda che dobbiamo porci è questa: quali proposizioni sono quelle che hanno un soggetto o soggetti e un predicato? È questo il caso di tutte le proposizioni o solo di alcune? Prima, però, di rispondere a questa domanda, dobbiamo ricordarci che il compito su cui siamo impegnati non è puramente un compito di grammatica inglese; non siamo bambini di scuola che analizzano frasi sul soggetto, l’estensione del soggetto, complemento e così via, ma siamo interessati non tanto nelle frasi stesse, quanto in quello che significano, da cui speriamo di scoprire la natura logica della realtà.

Quindi dobbiamo cercare i significati di soggetto e predicato che non sono puramente grammaticali, ma che hanno un vero e proprio significato logico.

Cominciamo con una certa proposizione come ‘ O Socrate è saggio o Platone è stupido ‘. A questa, probabilmente si sarà d’accordo, il concetto di soggetto e predicato è inapplicabile; ma può essere applicabile alle due parti ‘ Socrate è saggio ‘, ‘ Platone è sciocco ‘, ma l’intero ‘ O Socrate è saggio o Platone è sciocco ‘ è una proposizione alternativa e non una proposizione con un soggetto o predicato. Ma a questo qualcuno può fare la seguente obiezione: in una tale proposizione possiamo assumere qualsiasi termine ci pare, diciamo Socrate, essere il soggetto.

Il predicato sarà poi ‘ essere saggio a meno che Platone sia stupido ‘ o ​​la funzione proposizionale x^ è saggio o Platone è stupido ‘ .

La frase ‘ essere saggio a meno che Platone sia sciocco ‘ sta per un complesso universale che si afferma per caratterizzare Socrate. Un tale punto di vista, anche se molto spesso accettato, a me sembra, tuttavia, certamente sbagliato. Al fine di rendere le questioni più chiare prendiamo un caso più semplice, una proposizione nella forma ‘ aRb ‘; allora questa teoria sosterrà che ci sono tre proposizioni strettamente connesse; una afferma che la relazione R intercorra tra i termini a e b, la seconda asserisce il possesso da parte di a di un complesso di proprietà di ‘ avere R  con b ‘ mentre la terza afferma che b ha la proprietà complessa che a ha R con essa (b). Queste devono essere tre diverse proposizioni perché hanno diversi insiemi di costituenti, e ancora che non sono tre proposizioni, ma una proposizione, perché tutte dicono la stessa cosa, e cioè che a ha R con b. Così la teoria degli universali complessi è responsabile di una trinità incomprensibile, senza senso come quella della teologia. (1)

  1. (N.d.t. Questa espressione rivela i danni della cattiva espressione dei principi dottrinari a cui sono stati sottoposti i cristiani nella loro storia. Infatti nei testi di dottrina si definiva Dio come l’essere perfettissimo signore del cielo e della terra in tre persone uguali e distinte. Quindi si poneva il problema di capire come un Dio unitariamente definito potesse essere una trinità. E’ evidente che in questi termini si proponeva semplicemente una contraddizione logica perché la definizione di uno non può mai coincidere con la definizione di tre a meno di modificare l’aritmetica in modo sostanziale con il risultato tangibile di non poterla più usare nella pratica. Il problema è solo di comunicazione in quanto questo dare per nonsenso ed incomprensibile la trinità è un problema solo di comunicazione dottrinaria. La definizione della trinità deriva dalla necessità di dare una descrizione di un Dio trascendente (quindi fuori dal mondo fisico) con le seguenti due caratteristiche fondamentali: libero e Ente relazionale. Infatti L’uomo secondo la teologia giudaico-cristiana è stato creato ad immagine di Dio. E l’uomo è libero e relazionale. E’ abbastanza evidente che l’alternativa di un Dio unitariamente definito e non trascendente ovvero a teologia panteistica è una forma di materialismo che coincide con le motivazioni dell’ateismo. Mi sembra evidente che se tutto il mondo è Dio e quindi è soggetto alle limitazioni spazio-temporali ed etiche del nostro essere non c’è nessuna differenza con l’ateismo in quanto ha connotazioni perfettamente equivalenti. Tra l’altro un mondo così concepito risulta avere la caratteristica di non considerare necessaria la libertà e un’etica di cooperazione tra le persone in quanto tutto è regolato dal caso e lo scopo della vita di ogni singolo uomo sarebbe limitato a ridurre i casi sfavorevoli al minimo, senza poter comunque annullarli per essere l’avversità statisticamente prevalente dei casi contrari ai desiderata. Quindi per descrivere un Dio trascendente e relazionale come l’uomo che non è scindibile dalla sua relazionalità occorre definire l’unico Dio come Ente costituito di Persone in relazione tra loro. Per la definizione di perfezione, quindi non comprendendo in Dio l’egoismo, occorre che questa relazione sia lo scambio di amore tra il Padre ed il figlio mediato dallo Spirito, così come accade nell’uomo in cui lo scambio relazionale tra le persone avviene tramite il linguaggio di cui il sistema proposizionale è un mezzo importantissimo. Quindi come nel linguaggio il significato passa da A a B tramite, ad esempio la logica proposizionale, così l’Essere trasmette la sua essenza al Figlio tramite lo Spirito che, guarda caso, è anche comunicazione in quanto trasmette agli uomini l’indicibile di un Dio trascendente che non governa il mondo, ma fornisce informazione sulla libertà e l’uguaglianza fraterna degli uomini (quindi nelle loro diversità) e li invita all’adesione al Corpo mistico in cui possano partecipare, nelle loro individualità, al circuito di amore di Dio. Dio non può governare il mondo perché altrimenti verrebbe meno un altro polo della similitudine dell’uomo con Dio, ovvero la libertà di vivere e scegliere come meglio crede. L’espressione di Dio è quindi fatta tramite il linguaggio che ne da’ una rappresentazione, per poterne parlare, ma che non può corrispondere alla vera natura di Dio perché trascendente e quindi fuori del mondo spazio-temporale. In questo senso il concetto ha caratteristiche di mistero, ovvero riguarda una realtà che non possiamo esprimere e non perché riguarda una realtà che ci viene tenuta nascosta. E’ proprio la necessità di tenere come supremo principio la libertà che la rivelazione non può andare oltre i termini dei metodi di scelta umani ovvero non può che essere basata sull’informazione e non sul dato fisico diretto che toglierebbe qualsiasi libertà di scelta. Pertanto la presenza di Dio si sostanzierebbe nelle Parola che è il Verbo fatto carne e nella presenza dello Spirito che supporta materialmente la diffusione della Parola. E’ la libera scelta individuale di aderire al circuito dell’amore di Dio o di rifiutarlo. Secondo la teologia cristiana la libertà è nello stesso atto di fede che si concretizza nella fede nella speranza dell’amore di Dio. E quindi è la libera scelta di far parte del mondo di quanti amano il prossimo perché sperano nell’amore di Dio. Questo concetto di voler appartenere ad un gruppo è sempre stato presente negli uomini, spesso con deviazioni antisociali,ma anche con gruppi che seguono non solo l’interesse degli adepti ma che risultano essere anche aperti alle esigenze degli altri. Un esempio è proprio la Apostles Society di Cambridge che perseguiva lo scopo, associando le migliori menti matematiche dell’epoca, di promuovere lo sviluppo intellettuale di tutta l’umanità. Infine, per semplificare: la relazione aRb non può essere interpretata come una terna perché solo insieme è una relazione tra a e b e a nessuno verrebbe in mente di dire che una proposizione sia una e trina.)

Questo argomento può essere rafforzato prendendo in considerazione il processo di definizione, che è il seguente. Per certi scopi ‘aRb ‘ può essere un simbolo inutilmente lungo, così che sarebbe conveniente accorciarlo in ‘ φb . ‘ Questo viene fatto per definizione, φx = aRx, che significa che qualsiasi simbolo nella forma φx deve essere interpretato nel senso che si riferisce al corrispondente simbolo aRx, per il quale è un’abbreviazione. In casi più complessi tale abbreviazione è spesso molto utile, ma se ne potrebbe sempre fare a meno se il tempo e la carta lo permettono. Chi crede negli universali complessi è ora di fronte a un dilemma: è ​​’ φ ‘ , così definito, un nome per la complessa proprietà di x che consiste in a di avere R con x? Se è così, allora φx sarà l’affermazione che x ha questa proprietà; ma sarà una proposizione soggetto-predicato il cui soggetto è x e il predicato φ; e questo non è identico alla proposizione relazionale aRx .

Ma in quanto φx è per ipotesi definita essere l’abbreviazione di aRx questo è assurdo. Perché se una definizione non deve essere interpretata con il significato che il definiendum e il definiens hanno lo stesso significato, il processo di definizione diventa incomprensibile e si perde ogni giustificazione per l’interscambio tra definiens e definiendum a piacere, da cui dipende tutta la sua utilità. Supponiamo invece che ‘ φ ‘ , come sopra definito, non sia un nome per una proprietà complessa; allora come può la proprietà complessa mai diventare oggetto della nostra osservazione, e come possiamo mai parlarne, visto che ‘ φ ‘, il suo unico nome possibile, non è per nulla un nome ma un’abbreviazione per qualcos’altro? E poi che ragione ci può essere per postulare l’esistenza di questo oggetto?

Nonostante questa reductio ad absurdum della teoria, potrebbe valere ancora la pena di indagare la sua origine e sull’essere essa ritenuto da tante persone, tra cui in passato da me stesso, senza che si verifichi per essi di dubitarne. La ragione principale di questo è credo che si trovi nella comodità linguistica; essa ci dà un oggetto che e ‘ il significato ‘ di ‘ φ ‘. Spesso vogliamo parlare di ‘ il significato di ” φ “‘ ed è più semplice supporre che questo è un termine unico piuttosto che riconoscere che si tratta di una questione molto più complicata, e che ‘ φ ‘ ha una relazione di significato non con un oggetto complesso, ma con gli oggetti più semplici, che sono nominati nella sua definizione.

Vi è, tuttavia, un altro motivo per cui questo punto di vista è così popolare, e che è la difficoltà immaginaria che altrimenti sarebbe avvertita nell’uso di una funzione proposizionale variabile.

Come, ci si potrebbe chiedere, dobbiamo interpretare questa affermazione come ‘a ha tutte le proprietà di b ‘, tranne nell’ipotesi che esistano proprietà? La risposta è che deve essere interpretato come il prodotto logico di tutte le proposizioni che possono essere costruite nel seguente modo: prendiamo una proposizione in cui si a si presenta, per esempio φa, scambiamo a con b ed ottenere φb, e poi formiamo la proposizione φb . ⊃ . φa. In realtà non è così semplice come questo, ma una più accurata considerazione di questo coinvolgerebbe una quantità di noiosi dettagli, che quindi sarebbero fuori luogo qui; e possiamo assumere con una sufficiente approssimazione che ‘a ha tutte le proprietà di b ‘ è l’affermazione congiunta di tutte le proposizioni della forma φb . ⊃ . φa, dove non c’è necessità per φ di essere il nome di un universale, in quanto è solo il supporto di una proposizione in cui a si presenta. Di qui la difficoltà è del tutto immaginaria. Si può osservare che lo stesso vale per qualsiasi altro caso di variabili apparenti alcuni dei valori delle quali sono simboli incompleti, e questo può spiegare la tendenza ad affermare che alcuni simboli incompleti di Russell non sono realmente incompleti, ma i nomi di proprietà o di predicati.

Concludo, quindi, che gli universali complessi sono da respingere; e che una certa proposizione come ‘ O Socrate è saggio o Platone sciocco ‘ non ha né soggetto né predicato.

Argomentazioni analoghe valgono per ogni proposizione composta, cioè ogni proposizione contenente determinati termini come ‘e’ , ‘o’ , ‘non’ , ‘ tutto’ , ‘ qualche ‘; e quindi se vogliamo trovare una distinzione logica tra soggetto e predicato da qualche parte sarà nelle proposizioni atomiche, come le chiama Russell, che possono essere espresse da frasi che non contengono nessuna delle parole di cui sopra, ma solo nomi e, forse, una copula.

La distinzione tra soggetto e predicato allora deriverà dai diversi nomi in una proposizione atomica con funzioni differenti; e se questa non è una distinzione puramente grammaticale deve corrispondere ad una differenza nel funzionamento dei vari oggetti in un fatto atomico, in modo che ciò che dobbiamo innanzitutto esaminare è la costruzione del fatto atomico fuori dai suoi componenti. A proposito di questo potrebbero essere suggeriti tre punti di vista: il primo è quello di Johnson secondo cui i componenti sono collegati tra loro da ciò che egli chiama il vincolo che li caratterizza. La natura di questa entità è piuttosto oscura, ma penso che possiamo prenderlo come qualcosa che non è un costituente del fatto, ma rappresentato nel linguaggio della copula ‘ è’, e siamo in grado di descrivere questa teoria sostenendo che la congiunzione sia realizzata da una vera e propria copula .

Poi vi è la teoria di Russell che la congiunzione è realizzata da uno dei costituenti; che in ogni fatto atomico ci deve essere un componente che è per sua natura incompleto o connettivo e, per così dire, tiene gli altri componente insieme. Questo componente sarà un universale, e gli altri i particolari. Infine vi è la teoria di Wittgenstein che non esiste una copula, né un componente apposito connesso, ma che, come egli si esprime, gli oggetti si collegano l’uno all’altro, come gli anelli di una catena.

Dal nostro punto di vista è la seconda di queste teorie che richiede più attenzione; perché la prima e la terza in realtà non spiegano nessuna differenza nella modalità di funzionamento di soggetto e predicato, ma lasciano questo come un mero dogma. Solo nella teoria di Russell ci sarà una differenza intelligibile tra particolare e universale, basata sulla necessità che vi sia in ogni fatto un termine che collega o universale, che corrisponde alla necessità in ogni frase di avere un verbo.

Così è la teoria di Russell che dobbiamo prendere in considerazione per prima.

La grande difficoltà con questa teoria sta nel capire come una sorta di oggetto può essere appositamente incompleto. C’è un significato in cui qualsiasi oggetto è incompleto; cioè che può verificarsi solo in un fatto per un collegamento con uno o più oggetti di tipo opportuno; proprio come qualsiasi nome è incompleto, perché per formare una proposizione dobbiamo unirlo a determinati altri nomi di tipo adatto. Come dice Wittgenstein : “L’oggetto è indipendente, nella misura in cui può verificarsi in tutte le circostanze possibili, ma questa forma di indipendenza è una forma di connessione con il fatto atomico, una forma di dipendenza. (È impossibile per alcune parole presentarsi in due modi diversi, da sole e nella proposizione) ” 1 E Johnson : “In definitiva un universale rappresenta un aggettivo che può caratterizzare un particolare e un particolare rappresenta un sostantivo che può essere caratterizzato da un universale.” 2 Così possiamo ammettere che ‘ saggio ‘ comporta la forma di una proposizione, ma così è per’ Socrate ‘, ed è difficile vedere qualche fondamento per distinguerli tra loro.

Questa è la sostanza della critica di Johnson che Russell non permette che l’aggettivo stia da solo, e che nel trattare ‘ s è p ‘come una funzione di due variabili che assume che gli argomenti non siano s e p , ma s e ‘ Schermata 2013-08-22 alle 18.42.59  è p’.

1 Tractatus logico-philosophicus, 2.0122. “La cosa è indipendente nella misura in cui essa può occorrere in tutte le situazioni possibili, ma questa forma d’indipendenza è una forma di connessione con lo stato di cose, una forma di dipendenza (E’ impossibile l’occorrer di parole in due diversi modi, da sole e nella proposizione) – Einaudi Paperbacks trad. Amedeo G. Conte.

2 Logic Parte I, pag. 11.

In risposta a questa critica Russell, immagino, userebbe due linee di ragionamento, di cui dobbiamo esaminare la validità.

Il primo risiederebbe sulla grande convenienza nella logica matematica del suo simbolismo funzionale, del quale egli potrebbe dire non ci sarebbe nessuna spiegazione se non che questo simbolismo corrisponde alla realtà più da vicino di ogni altro. La sua seconda argomentazione sarebbe che ognuno può avvertire una differenza tra particolari e universali; che la prevalenza del nominalismo ha dimostrato che la realtà degli universali era sempre sospetta, e che questo era probabilmente perché essa differisce dai particolari per essere meno indipendente, meno autosufficiente. Anche che questa era l’unica ragione della differenza tra particolari e universali, che li rendono effettivamente tipi di oggetti diversi, come evidentemente erano, e non semplicemente diversi in relazione a noi o alla nostra lingua. Ad esempio Johnson descrive il particolare che si presenta al pensiero per il suo carattere di essere determinato nel pensiero, e altri potrebbero dire che un particolare sia quello che era significato dal soggetto grammaticale di una frase; e in base a questi punti di vista ciò che era particolare, quello che era universale dipenderebbero da caratteristiche inessenziali della nostra psicologia o del nostro linguaggio.

Prendiamo queste linee di ragionamento in ordine inverso, cominciando con l’avvertire la differenza tra particolare e universale, e rimandando la particolare convenienza simbolica delle funzioni proposizionali. Chiunque, si può dire, vede una differenza tra Socrate e la saggezza. Socrate è una vera entità indipendente, la saggezza una qualità e quindi essenzialmente una qualità di qualcos’altro. La prima cosa da notare su questo ragionamento è che in realtà non riguarda per niente oggetti.

‘ Socrate è saggio ‘ non è una proposizione atomica, e i simboli ‘ Socrate ‘e’ saggio ‘ non sono i nomi di oggetti, ma simboli incompleti. E secondo Wittgenstein, con cui son d’accordo, questo sarà il fatto con qualsiasi altro esempio che può essere suggerito, dal momento che non siamo messi al corrente con alcuni oggetti autentici o proposizioni atomiche, ma semplicemente li deduciamo come presupposto da altre proposizioni. Quindi la distinzione che avvertiamo è quella tra due tipi di simboli incompleti, o costruzioni logiche, e non si può dedurre senza ulteriori indagini che ci sia una qualche corrispondente distinzione tra due tipi di nomi o oggetti.

Noi possiamo, credo, facilmente ottenere un’idea più chiara della differenza tra questi due tipi di simboli incompleti (Wittgenstein le chiama ‘espressioni’), caratterizzate da ‘ Socrate ‘ e ‘ saggio ‘.

Consideriamo quando e perché un’espressione si presenta, per così dire, come una singola unità. Per esempio ‘ aRb ‘ non si divide naturalmente in ‘a’ e ‘ Rb ‘ , e vorremmo sapere perché qualcuno dovrebbe quindi dividere e isolare l’espressione ‘Rb ‘ . La risposta è che se fosse una questione di questa sola proposizione, non ci sarebbe motivo di dividerla in questo modo, ma che l’importanza delle espressioni si pone, come sottolinea Wittgenstein, solo in rapporto alla generalizzazione.

Non è ‘ aRb ‘ ma ‘ ( x ) . xRb ‘ che rende Rb importante.

Nello scrivere ( x ) . xRb usiamo l’espressione Rb per raccogliere insieme l’insieme delle proposizioni xRb che vogliamo affermare essere vere; ed è qui che l’espressione Rb è veramente essenziale, perché è questo che è comune a questo insieme di proposizioni. Se ora ci rendiamo conto che questo è l’uso essenziale delle espressioni, possiamo vedere immediatamente qual è la differenza tra Socrate e saggio. Attraverso l’espressione ‘ Socrate ‘ raccogliamo insieme tutte le proposizioni in cui si verificano, cioè, tutte le proposizioni che dovremmo ordinariamente dire di essere intorno a Socrate, come ‘ Socrate è saggio ‘, ‘ Socrate non è né saggio né giusto ‘. Queste proposizioni sono raccolte insieme come valori di ‘ φ Socrate ‘, dove φ è una variabile.

Consideriamo ora l’espressione ‘ saggio; usiamo questa per raccogliere insieme le proposizioni ‘ Socrate è saggio ‘ , ‘ Platone è saggio ‘ , e così via , che sono i valori di’ x è saggio ‘ . Ma questo non è l’unico insieme che possiamo usare per costruire ‘ saggio’; proprio come abbiamo usato ‘ Socrate ‘ per raccogliere tutte le proposizioni in cui si verificava, possiamo usare ‘ saggio ‘ per raccogliere tutte quelle in cui si verifica questo, comprese non solo quelle come ‘ Socrate è saggio’, ma anche quelle come ‘ né Socrate né Platone sono saggi ‘, che non sono valori di ‘ x è saggio ‘, ma solo della diversa funzione ‘ φ saggio ‘, dove φ è una variabile . Così mentre Socrate dà solo un insieme di proposizioni, saggio ne da’ due: una simile a quella data da Socrate, vale a dire l’insieme di tutte le proposizioni in cui si verifica saggio, e l’altra un insieme più ristretto di proposizioni della forma ‘ x è saggio ‘ .

Questa è ovviamente la spiegazione della differenza che avvertiamo tra Socrate e saggio, che Russell esprime dicendo che con saggio dobbiamo introdurre la forma di una proposizione. Dal momento che tutte le espressioni devono essere completate per formare una proposizione, era già difficile capire come saggio potesse essere più incompleto di Socrate. Ora possiamo vedere che la ragione di questo è che, mentre con ‘ Socrate ‘ abbiamo solo l’idea di completarlo in qualche modo in una proposizione, con ‘ saggio ‘ non abbiamo solo questo, ma anche l’idea di completarlo in un modo particolare, fornendoci non solo una qualsiasi proposizione in cui si presenta saggio, ma anche quella in cui si verifica in un modo particolare, che potremmo chiamare la sua presenza come predicato, come in ‘ Socrate è saggio ‘.

A che cosa è dovuta questa differenza, ed è una vera differenza? Vale a dire, non possiamo fare con ‘ Socrate ‘ quello che facciamo con ‘ saggio’, e usarlo per raccogliere un insieme di proposizioni più ristrette di tutto l’insieme in cui si verifica? È questo impossibile, o è semplicemente che in realtà non lo facciamo mai? Queste sono le domande a cui ora dobbiamo cercare di rispondere. Il modo per farlo sembrerebbe essere il seguente Supponiamo che possiamo distinguere tra le proprietà di Socrate un certo sottoinsieme che possiamo chiamare qualità, l’idea sarebbe più o meno che una semplice proprietà è una qualità. Allora potremmo formare in collegamento con ‘ Socrate ‘ due serie di proposizioni così come possiamo in connessione con ‘ saggio’. Ci sarebbe una più vasta serie di proposizioni in cui ‘ Socrate ‘ si presenta del tutto, che noi diciamo che affermino le proprietà di Socrate, ma anche ci sarebbe un insieme più ristretto che asserisce le qualità di Socrate.

Quindi supponendo che giustizia e saggezza siano qualità, ‘ Socrate è saggio ‘ , ‘ Socrate è giusto ‘ apparterrebbero al gruppo più ristretto e sarebbero i valori di una funzione ‘ Socrate è q ‘. Ma ‘ Socrate non è né saggio né giusto ‘ non asserirebbe una qualità di Socrate, ma solo una caratteristica complessa o di proprietà, e sarebbe solo un valore della funzione ‘ φ Socrate ‘, non di ‘ Socrate è q ‘.

Ma anche se una tale distinzione fra qualità e proprietà può essere logicamente possibile, non sembriamo mai tenerne conto sistematicamente . Qualche luce può essere gettata su questo fatto da un paragrafo in Logic di Johnson in cui egli sostiene che, sebbene ” possiamo costruire correttamente un aggettivo composto da semplici aggettivi, tuttavia la natura di qualsiasi termine con funzione di sostantivo è tale che è impossibile costruire un autentico sostantivo composto”.1 Così dalle due proposizioni ” Socrate è saggio ‘, ‘ Socrate è giusto ‘ possiamo formare la proposizione ‘ Socrate non è né saggio né Socrate è giusto’, o , in breve, ‘ Socrate non è né saggio né giusto’; che ancora, secondo Johnson, afferma che un aggettivo di Socrate, è un valore di ‘ φ Socrate ‘ e ​​giustificherebbe ‘ ( ∃ φ ) . φ Socrate ‘ o’ Socrate ha qualche proprietà ‘.

1 Parte II, p. 61.

Se, d’altra parte, prendiamo le due proposizioni ” Socrate è saggio ‘ , ‘ Platone è saggio ‘ e formiamo da queste ‘ Né Socrate è saggio né Platone è saggio ‘; questo non è un valore di ‘ x è saggio ‘ e non giustificherebbe ‘ ( ∃ x ) . x è saggio ‘, o ‘ Qualcuno è saggio ‘. Quindi, in quanto ‘ Socrate non è né saggio né giusto ‘ giustifica ‘ Socrate ha qualche aggettivo ‘ possiamo dire che ‘ né saggio né giusto ‘ è un aggettivo composto; ma poiché ‘ né Socrate né Platone sono saggi ‘ non giustifica che ‘ qualcuno è saggio ‘ , ‘ né Socrate , né Platone ‘ non può essere un sostantivo composto non di più di quanto qualcuno sia un uomo composto.

Se, tuttavia, noi potessimo formare un insieme di qualità contrapposte a proprietà, ‘ Socrate non è né saggio né giusto ‘ non giustificherebbe ‘ Socrate ha una certa qualità e ‘ né saggio, né giusto’ non sarebbero una qualità. Contro questo Johnson dice che non esiste un criterio universalmente valido con il quale possiamo distinguere le qualità da altre proprietà; e questa è certamente una contesa molto plausibile quando si parla, come noi ora, delle qualità e delle proprietà delle costruzioni logiche come Socrate. Perché la distinzione è solo realmente evidente in relazione ad un autentico oggetto; allora possiamo dire che φ rappresenta una qualità quando φa è una proposizione atomica a due termini, e questo distinguerebbe le qualità da altre funzioni proposizionali o proprietà. Ma quando il soggetto a è una costruzione logica e φa una proposizione composta di cui non conosciamo l’analisi, è difficile sapere che cosa significherebbe chiedendo se φ sia semplice, e chiamandola, se semplice, qualità. Avremmo chiaramente una questione non di assoluta ma di relativa semplicità.

Eppure è facile vedere che, in teoria, una analoga distinzione può certamente essere fatta anche per i simboli incompleti. Prendiamo qualsiasi simbolo incompleto ‘ α’; questo sarà definito non isolatamente, ma in combinazione con qualsiasi simbolo di un certo tipo x . Così potremmo definire che αx significa αRx . Allora questo simbolo incompleto ‘α’ ci darà due insiemi di proposizioni: l’insieme αx ottenuto completandolo nel modo indicato nella sua definizione; e l’insieme generale delle proposizioni in cui α si verifica affatto, vale a dire tutte le funzioni verità delle proposizioni dell’insieme precedente e le proposizioni costanti che non contengono α. Così, nei due casi famosi delle descrizione e delle classi, come trattati in Principia Mathematica, l’insieme più ristretto sarà quello in cui la descrizione o la classe ha una evenienza primaria, l’insieme più ampio quello in cui ha qualche tipo di evenienza primaria o secondaria, dove il termine di evenienza ‘ primaria’ e ‘secondaria’ hanno i significati spiegati in Principia . In sintesi per quanto riguarda qualsiasi simbolo incompleto possiamo distinguere il suo presentarsi primario e secondario, e questa è fondamentalmente la stessa distinzione che abbiamo trovato essere caratteristica dell’aggettivo. Così che qualsiasi simbolo incompleto è in realtà un aggettivo, e quelli che appaiono sostantivi solo lo sono in virtù della nostra mancanza di distinguere o per l’incapacità o per la negligenza le loro evenienze primarie e secondarie. Come esempio pratico prendiamo il caso degli oggetti materiali; siamo abituati a considerarli come sostantivi, vale a dire che noi li usiamo per definire gli insiemi di proposizioni in un modo solo, e non facciamo distinzione tra loro evenienze primarie e secondarie. Almeno nessuno ha introdotto tale differenziazione finché Whitehead ha dichiarato che gli oggetti materiali sono aggettivi degli eventi in cui sono situati, in modo che il verificarsi primario di un oggetto materiale A è in una proposizione ‘ A si trova in E ‘.

Da tali proposizioni come questa possiamo costruire tutte le altre proposizioni in cui A si presenta. Così ‘ A è rosso’ sarà ‘ per tutte le E , A si trova in E implica che il rosso si trova in E ‘, in cui A ha una presenza secondaria. Quindi la distinzione tra un verificarsi primario e secondario non è semplicemente dimostrato come logicamente necessario, ma in questo caso effettuato praticamente.

La conclusione è che, per quanto riguarda i simboli incompleti, la fondamentale distinzione non è tra sostantivo e aggettivo, ma tra un’evenienza primaria e secondaria; e che un sostantivo è semplicemente una costruzione logica tra cui non riusciamo a distinguere le evenienze primarie e secondarie. In modo che essere un sostantivo non è una proprietà oggettiva, ma soggettiva nel senso che non dipende infatti da una qualsiasi mente, ma dagli elementi comuni nelle menti e le finalità di tutti gli uomini .

Questa è la mia prima conclusione, che è credo di una certa importanza nella filosofia della natura e della mente; ma non è la conclusione che che più desidererei sottolineare, e non risponde alla domanda con cui ho iniziato il mio articolo. Perché si tratta di una conclusione sul metodo e la possibilità di dividere alcune costruzioni logiche in sostantivi e aggettivi, essendo questa in relazione con quelle costruzioni logiche che hanno originato per tradizione l’idea di aggettivo e di sostantivo.

Ma la vera domanda in questione è la possibilità non di dividere le costruzioni logiche, ma reali oggetti in particolari e universali, e per rispondere a questo dobbiamo tornare indietro e riprendere il filo del discorso, dove l’abbiamo abbandonato per questa lunga digressione sulle costruzioni logiche .

Abbiamo visto in precedenza che la distinzione tra particolare e universale è derivato da quella tra soggetto e predicato che abbiamo trovato solo che si verifica nelle proposizioni atomiche. Abbiamo poi esaminato le tre teorie delle proposizioni atomiche o meglio, dei fatti atomici, la teoria di un legame di Johnson, di Russell che l’unione è determinata dagli universali dei quali qui deve esisterne uno e solo uno in ogni fatto atomico, e di Wittgenstein secondo cui gli oggetti si uniscono l’uno all’altro come gli anelli di una catena. Abbiamo osservato che di queste teorie solo quella di Russell realmente assegnava una funzione diversa al soggetto e al predicato e così ha dato un significato alla distinzione tra questi, e si è proceduto a discutere questa teoria. Abbiamo trovato che alle critiche di Johnson Russell aveva due risposte possibili; una che è quella di sostenere che la sua sola teoria ha tenuto conto della differenza che avvertiamo esserci tra Socrate e la saggezza, l’altra che la sua notazione è molto più opportuna di qualsiasi altra e deve quindi corrispondere più strettamente ai fatti. Abbiamo poi preso il primo di questi argomenti , e esaminato la differenza tra Socrate e saggezza. Ciò che abbiamo trovato consiste nel fatto che mentre Socrate determinava solo una serie di proposizioni in cui si presenta, saggio determinava due di tali insiemi, l’insieme completo ‘f saggio’, e l’insieme più ristretto ‘ x è saggio ‘. Abbiamo poi esaminato il motivo di questa differenza tra i due simboli incompleti Socrate e saggio, e abbiamo deciso che era di carattere soggettivo e dipendeva da interessi ed esigenze umani.

Quello che dobbiamo ora considerare è se la differenza tra Socrate e saggio ha una tale attinenza sulla composizione dei fatti atomici come Russell asserisce che esso abbia. Possiamo utilmente coniugare questo con la considerazione dell’altro possibile argomento di Russell dalla comodità superiore del suo simbolismo. L’essenza di questo simbolismo, come Johnson ha osservato, consiste nel non lasciare l’aggettivo da solo, ma nel renderlo una funzione proposizionale con il collegarlo a una variabile x. Un possibile vantaggio di questa procedura ad un tempo si suggerisce nei termini del nostro precedente trattamento della differenza tra sostantivo e aggettivo; e cioè che aggiungere la variabile x ci aiuta a fare la distinzione che noi richiediamo di fare nel caso dell’aggettivo, ma non nel caso del sostantivo, fra i valori di φx e quelli di f ( φz circonflesso ) dove f è una variabile. Solo così, si potrebbe dire, possiamo distinguere ( x ) . φx da ( f), f . ( φz circonflesso ). Ma una piccola considerazione è richiesta per vedere che questo vantaggio è molto leggero e di nessuna importanza fondamentale. Si potrebbe facilmente fare la distinzione in altri modi; per esempio determinando che se la variabile è venuta dopo il φ che dovrebbe significare che noi ora l’esprimiamo con φx, ma se prima di φ ciò che esprimiamo con f ( φz circonflesso ); o semplicemente nel decidere di utilizzare le lettere « x ‘ , ‘ y ‘ , ‘ z ‘, in un caso , ‘ f ‘ , ‘ g ‘ , ‘ h ‘, nell’altro.

Ma , sebbene questo supposto vantaggio nella simbologia funzionale sia immaginario, c’è un motivo che lo rende assolutamente indispensabile. Prendete una certa proprietà come ‘ o che abbia una R con a , o che abbia una S con b ‘; sarebbe assolutamente impossibile rappresentare questo con un semplice simbolo ‘ φ ‘. Perché allora come potremmo definire φ? Non potremmo porre φ = Ra . v . Sb perché non sapremmo se gli spazi vuoti erano da riempire con gli stessi o differenti argomenti, e quindi se φ sia una proprietà o una relazione. Invece dobbiamo mettere φx . = . xRa . v . xSb; che spiega non cosa si intende per φ in sé stessa, ma quello che segue da qualsiasi simbolo x è l’abbreviazione di xRa . v . xSb. E questa è la ragione che rende inevitabile l’introduzione delle funzioni proposizionali. Significa semplicemente che in questo caso ‘ φ ‘ non è un nome ma un simbolo incompleto e non può essere definito in isolamento o non può essere lasciato stare da solo.

Ma questa conclusione su xRa . v . xSb non si applica a tutte le funzioni proposizionali. Se φa è una proposizione atomica a due termini, ‘ φ ‘ è il nome del termine diverso da a, e può benissimo stare da solo; così ci si potrebbe chiedere , perché scriviamo ‘ φx ‘ invece di ‘ φ ‘ anche in questo caso? La ragione di questo risiede in una caratteristica fondamentale della logica matematica, la sua estensionalità, e con questo intendo il suo interesse primario nelle classi e nelle relazioni in estensione. Ora, se in qualsiasi proposizione quale che sia cambiamo qualsiasi particolare nome con una variabile, la funzione proposizionale risultante definisce una classe; e la classe può essere la stessa per le due funzioni di forme molto diverse, in una delle quali ‘ φ ‘ è un simbolo incompleto, nell’altra un nome. Quindi la logica matematica, essendo interessata solo nelle funzioni con significato di classi, si vede che non ha la necessità di distinguere questi due tipi di funzioni, perché la differenza tra queste, sebbene del tutto importante in filosofia, non corrisponderebbe ad alcuna differenza tra le classi che essa definisce. Così perché alcuni φ sono incompleti e non possono stare da soli, tutti i φ di devono essere trattati allo stesso modo al fine di evitare complicazioni inutili, l’unica soluzione è quella di non consentire a nessuno di stare da soli.

Tale è la giustificazione pratica di Russell; ma è anche la confutazione della sua teoria, che non riesce ad apprezzare la distinzione tra le funzioni che sono nomi e quelle che sono simboli incompleti, una distinzione che, come osservato in precedenza, sebbene irrilevante per la matematica è essenziale per la filosofia. Non voglio indicare che Russell negherebbe questa distinzione; al contrario è evidente dalla seconda edizione dei Principia che l’accetterebbe; ma penso che la sua teoria attuale degli universali è il residuo della sua precedente incapacità di apprezzare questo.

Si ricorderà che abbiamo trovato due argomenti possibili per la sua teoria degli universali. Uno derivava dall’efficienza della notazione funzionale; questo chiaramente decade perché, come abbiamo visto, la notazione funzionale semplicemente trascura una distinzione fondamentale che non appare interessare il matematico, e il fatto che alcune funzioni non possono stare da sole non è la dimostrazione che tutte non possono stare da sole. L’altro argomento era per la differenza che avvertiamo tra Socrate e saggio, che corrisponde ad una differenza nel suo sistema logico tra particolari e funzioni. Proprio come Socrate determina un insieme di proposizioni, ma saggio due serie, così a determina un insieme φa , ma φz circonflesso i due insiemi φx e f ( φz circonflesso ). Ma a che cosa è dovuta questa differenza tra particolari e funzioni? Anche in questo caso semplicemente al fatto che certe cose non interessano il matematico. Chiunque fosse interessato non solo nelle classi di oggetti, ma anche nelle loro qualità, distinguerebbe tra le altre quelle funzioni che siano nomi; e se abbiamo chiamato gli oggetti di cui le loro qualità sono nomi, e denotato una qualità variabile con q, dovremmo avere non solo l’insieme φa, ma anche l’insieme più ristretto qa, e l’analoga differenza di quella tra ‘ Socrate ‘ e ​​la saggezza ’ scomparirebbe. Dovremmo avere una completa simmetria tra qualità e particolari; ognuno potrebbe avere nomi che potrebbero stare da soli, ognuno determinerebbe due insiemi di proposizioni, perché a determinerebbe gli insiemi qa e φa, dove q e φ sono variabili, e q determinerebbe gli insiemi qx e fq, dove x ed f sono variabili.

Quindi, se non fosse per l’interesse influenzato dai pregiudizi dei matematici egli poteva inventare un simbolismo che era completamente simmetrico per quanto riguarda particolari e qualità; e diventa evidente che non c’è significato nelle parole particolare e qualità; tutto quello di cui stiamo parlando riguarda due differenti tipi di oggetti, tale che due oggetti, uno di ciascun tipo, possono essere unici componenti di un fatto atomico . Essendo i due tipi in ogni modo simmetricamente correlati, nulla può avere senso nel chiamare un tipo il tipo particolare e l’altro il tipo della qualità, e queste due parole sarebbero prive di connotazione.

A questo, però, varie obiezioni potrebbero essere fatte che devono essere brevemente trattate. In primo luogo si può dire che i due termini di un certo fatto atomico devono essere collegati da un legame caratterizzante e/o da una relazione che li caratterizza, che è asimmetrica, e che distingue le loro relazioni in particolari e qualità. Contro questo direi che il rapporto di caratterizzazione è semplicemente una finzione verbale. ‘ q caratterizza a ‘ non significa né più né meno che ‘ a è q ‘ , è semplicemente una forma verbale allungata; e dal momento che la relazione di caratterizzazione non è certamente un costituente di ‘ a è q ‘ non può esserlo del tutto. Per quanto riguarda il collegamento, non riesco a capire che tipo di una cosa sarebbe, e preferisco il punto di vista di Wittgenstein che nel fatto atomico gli oggetti sono collegati tra loro senza l’aiuto di alcun mediatore 1. Ciò non significa che il fatto è semplicemente la raccolta dei suoi costituenti ma consiste nella loro unione senza alcun vincolo di mediazione. C’è un’altra obiezione in più suggerita dalla trattazione di Russell nella nuova edizione dei Principia . Egli ci dice che tutte le proposizioni atomiche sono nelle forme R1 ( x ), R2 ( x , y ), R3 ( x , y , 2 ), ecc., e così possono definire i particolari come termini che possono verificarsi in proposizioni con qualsiasi numero di termini; mentre, naturalmente, una relazione di n termini potrebbe verificarsi solo in una proposizione con n + 1 termini.

1 N.d.t. Si tratta del ripristino del Rasoio di Occam che è un punto fondamentale del sistema logico di Wittgenstein

Ma questo presuppone la sua teoria in merito alla costituzione dei fatti atomici, che ognuno deve contenere un termine di un tipo speciale, chiamato universale; una teoria che abbiamo trovato essere del tutto infondata.

La verità è che non sappiamo e possiamo sapere assolutamente nulla circa le forme delle proposizioni atomiche; noi non sappiamo se alcuni o tutti gli oggetti possono verificarsi in più di una forma di proposizione atomica; e non c’è ovviamente modo di definire una questione di questo genere. Non possiamo nemmeno dire che non ci sono fatti atomici costituiti da due termini dello stesso tipo.

Si potrebbe pensare che questo ci condurrebbe ad un circolo vizioso di contraddizioni, ma una piccola riflessione mostrerà che non lo fa, perché le contraddizioni dovute al lasciare che una funzione sia solo il proprio argomento sorgono quando assumiamo per argomento una funzione contenente una negazione che è quindi un simbolo incompleto non il nome di un oggetto.

In conclusione, cerchiamo di descrivere da questo nuovo punto di vista la procedura del logico matematico. Egli prende qualsiasi tipo di oggetti quale che siano come soggetto del suo ragionamento, e li chiama particolari, intendendo con ciò semplicemente che ha scelto questo tipo per ragionarne in merito, anche se avrebbe potuto ugualmente bene scegliere qualsiasi altro tipo e chiamarli particolari.

I risultati del sostituire i nomi di questi particolari nelle proposizioni con variabili allora li chiamerebbe le funzioni, indipendentemente dal fatto che la parte costante della funzione sia un nome o un simbolo incompleto, perché questo non fa alcuna differenza per la classe che la funzione definisce. L’incapacità di fare questa distinzione ha portato a questi simboli funzionali, alcuni dei quali sono nomi e alcuni incompleti, ad essere trattati tutti ugualmente come nomi di oggetti incompleti o proprietà, ed è responsabile di quella grande confusione nella teoria degli universali . Di tutti i filosofi solo Wittgenstein ha visto attraverso questa confusione e ha dichiarato che sulle forme delle proposizioni atomiche non possiamo sapere assolutamente nulla.

V

NOTE SULL’ARTICOLO PRECEDENTE (1926)

. . . Quando ho scritto il mio articolo ero sicuro che era impossibile scoprire le proposizioni atomiche con un’analisi vera e propria.

Di questo sono ora molto dubbioso, e non posso quindi essere sicuro che esse non possono essere scoperte essere tutte di una o dell’altra di una serie di forme che può essere espressa da R1 ( x ) , R2 ( x , y) , R3 ( x , y , z ) , ecc., nel qual caso potremmo, come Russell ha suggerito, definire i particolari come termini che possono verificarsi in proposizioni di una qualsiasi di queste forme, gli universali come termini che possono presentarsi in una sola forma. Ammetto che questo può essere trovato essere il caso, ma come nessuno può ancora essere certo di quale tipo di proposizione atomica si tratti, questo non si può affermare con certezza; e non c’è una una forte supposizione a suo favore, perché credo che l’argomento del mio articolo stabilisca che nulla del genere può essere conosciuto a priori.

E questa è una questione di una certa importanza, per i filosofi dal momento che Russell ha pensato che, anche se non sapeva in che termini ultimi le proposizioni fossero analizzabili, questi termini devono comunque essere divisibili in universali e particolari, categorie che vengono utilizzate nelle indagini filosofiche come se fosse certo a priori che a queste sarebbero applicabili. Questo certamente sembra essere derivato principalmente dal presupposto che ci deve essere una differenza tra gli oggetti fondamentali analogo a quello che avvertiamo sussistere tra certi termini come Socrate e saggio; e per vedere se questo può ragionevolmente essere sostenuto, dobbiamo scoprire che differenza c’è tra Socrate e saggio analoga alla distinzione operata nel sistema di Russell tra particolari e universali.

Se consideriamo lo sviluppo del sistema della logica di Russell, come esposto nella Premessa alla seconda edizione dei Principia Mathematica, possiamo vedere che differenza ci sia nel suo trattamento dei particolari e degli universali. Troviamo che gli universali si presentano sempre come funzioni proposizionali, che servono a determinare gli insiemi delle proposizioni, in particolare l’insieme dei valori della funzione φx, e l’insieme delle funzioni di funzione f ( φSchermata 2013-08-22 alle 18.42.59 ) (dove f è una variabile). I particolari servono anche per determinare insiemi di proposizioni, ma in questo caso vi è un unico insieme principale, l’insieme delle funzioni del particolare φa ( con φ variabile). Potremmo fare un insieme più ristretto, come Russell sottolinea, utilizzando una variabile qualità, ma non abbiamo bisogno di farlo. Ora, questa è l’unica differenza tra le funzioni di particolari e di universali nel suo sistema, e come troviamo che c’è una precisa differenza simile tra Socrate e saggio, è probabile che sia qui il nucleo della questione. Saggio, come un φx nel sistema di Russell, determina l’intervallo più ristretto di proposizioni ‘ x è saggio ‘ e quello più ampio ‘f saggio’, dove l’ultimo insieme comprende tutte le proposizioni quale che sia in cui si verifica saggio. Socrate, invece , viene utilizzato solo per determinare il più ampio insieme di proposizioni in cui si verifica in qualsiasi modo; non abbiamo un modo preciso di disfarci di un qualsiasi intervallo ristretto. Non possiamo farlo limitandolo a proposizioni in cui Socrate si presenta come soggetto, perché in ogni proposizione in cui si presenta esso può essere considerato come il soggetto: possiamo sempre considerare la proposizione come se dicesse ‘ E’ vero di Socrate che-‘. Il punto è che con Socrate la gamma più ristretta è omessa . . . .

Tuttavia questa differenza tra Socrate e saggio è illusoria, perché può essere dimostrato essere teoricamente possibile realizzare un insieme simile più ristretto per Socrate, sebbene non avessimo mai avuto bisogno di farlo. Tuttavia, una volta che questo fatto viene osservato, la differenza tra Socrate e saggio cade, e cominciamo, come Whitehead, a chiamare Socrate un aggettivo. Se pensate che tutte o quasi tutte le proposizioni sugli oggetti materiali siano funzioni verità di proposizioni sulla loro posizione negli eventi, allora, secondo il mio punto di vista, state considerando gli oggetti materiali come aggettivi di eventi. Perché questo è il vero significato della distinzione tra aggettivo e sostantivo. Non dico che la distinzione è sorta dalla riflessione esplicita circa la differenza in relazione agli insiemi di proposizioni, ma che questa differenza oscuramente avvertita è l’origine della distinzione. Il mio punto di vista è sorprendentemente confermato dall’argomentazione di Whitehead, il quale, avendo considerato gli oggetti materiali simili a saggio nel modo in questione, quindi ha dichiarato che erano aggettivi.

On a problem of formal logic – Parte III di The Foundation of Mathematics di Frank Ramsey

23 Mag

Schermata 44Propongo la mia traduzione della terza parte delle opere pubblicate di Frank Plumpton Ramsey  raccolte da R. B. Braithwaite sotto il titolo The Foundation of Mathematics.

Questa sezione riguarda la possibilità di trovare una procedura per determinare la verità o la falsità di una qualsiasi formula logica. Non intendo mettere l’accento sulle conseguenze virtuose nell’uso di questa metodologia, ma preferisco sotolineare l’originalità ed il rigore scientifico di questo lavoro se avrete cura di leggere attentamente i procedimenti logici impiegati in larghissima misura originali.

III

Su un problema di logica formale (1928)

Questo documento riguarda principalmente un caso particolare di uno dei problemi principali della logica matematica, il problema di trovare una procedura fissa per determinare la verità o falsità di una determinata formula logica. 1 Ma nel corso di questa indagine , è necessario utilizzare alcuni teoremi sulle combinazioni che hanno un interesse indipendente e sono più opportunamente posti per sé stessi nella parte iniziale.

I

I teoremi che effettivamente ci necessitano riguardano solo le classi finite, ma cominceremo con un teorema simile sulle classi infinite che è più facile da dimostrare e dà un semplice esempio del metodo della discussione.

TEOREMA A. Sia Γ una classe infinita, e μ e r siano degli interi positivi; e posto che tutte quelle sotto – classi di Γ che hanno esattamente r membri, o, come potremmo dire, posto che che tutte le r- combinazioni dei membri di Γ siano suddivisi in qualche modo in μ classi mutuamente esclusive Ci ( i = 1 , 2 , … , μ ), in modo che ogni r- combinazione sia un membro di una e una sola Ci; allora, assumendo l’Assioma delle Selezioni, Γ deve contenere una sottoclasse infinita Δ tale che tutte le r- combinazioni dei membri di Δ appartengono alla stessa Ci.

Consideriamo prima il caso μ = 2. (Se μ = 1 non vi è nulla da dimostrare.) Il teorema è banale quando r è 1, e lo dimostriamo per ogni valore di r per induzione. Supponiamo che, quindi, quando r = ρ -1 e lo deduciamo per r = ρ, che vi siano, dal momento che μ = 2 , solo due classi Ci , cioè C1 e C2.

1 Chiamato in tedesco Entscheidungsproblem ; vedi Hilbert und Ackermann , Grundzüge der Theoretischen Logik, pp 72-81.

Può accadere che Γ contenga un x1 membro e una sotto – classe infinita Γ1, non comprendente x1, tale che le ρ combinazioni, comprensive di x1 insieme a un qualsiasi ρ – 1 membri di Γ1, appartengano tutte a C1. Se è così, Γ1 può parimenti contenere un membro x2 e una sotto- classe infinita Γ2, non comprendente x2, tale che tutte le ρ combinazioni, comprensive di x2 insieme con i membri ρ -1 di Γ2, appartengano a C1. E, ancora, Γ2 può contenere un x3 e un Γ3 con proprietà simili, e così via all’infinito.

Abbiamo così due possibilità: o siamo in grado di selezionare in questo modo due sequenze infinite di membri di Γ (x1 , x2 , … , xn , … ), e di infinite sottoclassi di Γ ( Γ1 , Γ2 , . .. , Γn , … ) , in cui xn è sempre un membro di Γn – 1, e Γn una sotto- classe di Γn – 1 che non include xn , tale che tutti le ρ- combinazioni , comprensive di xn insieme ai ρ – 1 membri di Γn, appartengano a C1; altrimenti il ​​processo di selezione cadrebbe a un certo stadio, diciamo all’n -esimo, perché Γn – 1 (o se n = 1 , Γ stesso) non conterrà nessun membro xn e la sub – classe infinita Γn non comprendente xn così che tutte le ρ combinazioni, comprensive di xn insieme ai ρ – 1 membri di Γn appartengano a C1. Prendiamo a loro volta queste possibilità.

Se il processo va avanti per sempre assumiamo che Δ sia la classe ( x1 , x2 , .. , xn , … ) .Allora tutte queste x sono diverse, in quanto se r > s , xr è un membro di Γr – 1 e così di Γr – 2 , Γr – 3 , . . . , e in ultima analisi di Γs che non contiene xs. Quindi Δ è infinito. Anche tutte le ρ combinazioni dei membri di Δ appartengono a C1; perché se xs è un certo termine di una tale combinazione con almeno un suffisso s, gli altri termini ρ -1 della combinazione appartengono a Γs , e così formano con xs una ρ – combinazione appartenente a C1. Γ quindi contiene una sotto – classe Δ infinita del tipo richiesto.

Supponiamo , invece , che il processo di selezione della x e di Γ fallisca nella fase n -esima, e che y1 sia un qualsiasi membro di Γn – 1. Allora le combinazioni ( ρ -1 ) dei membri Γn – 1 – ( y1 ) possono essere suddivise in due classi mutuamente esclusive C’1 e C’2 secondo le ρ combinazioni formate aggiungendo ad essi y1 che appartiene a C1 o C2, e per il nostro teorema (A), che stiamo assumendo per vero quando r = ρ -1 ( e μ = 2 ), Γn – 1 – ( y1 ) deve contenere una sottoclasse infinita  Δ1, in modo tale che tutte le combinazioni ( ρ – 1 ) dei membri Δ1 appartengono alla stessa C’i; cioè tale che le ρ combinazioni formate unendo y1 ai membri ρ -1 di Δ1 appartengono tutti alla stessa Ci.

Inoltre, questo Ci non può essere C1, o y1 e Δ1 potrebbe essere assunto essere xn e Γn , e il nostro precedente processo di selezione non avrebbe fallito allo stadio n – esimo. Di conseguenza, le ρ combinazioni formate unendo y1 ai ρ -1 membri di Δ1 appartengono tutti a C2. Consideriamo ora Δ1 e sia y2 uno dei suoi membri. Ripetendo il precedente ragionamento Δ1 – ( y2 ) deve contenere una sottoclasse infinita Δ2 così che tutte le ρ combinazioni ottenute unendo y2 ai ρ -1 membri di Δ2 appartengono alla stessa Ci. E , ancora, questa Ci non può essere C1, o, dal momento che y2 è un membro e Δ2 una sotto – classe di Δ1 e così di Γn – 1 che include Δ1 , y2 e Δ2 avrebbe potuto essere scelto come xn e Γn e il processo di selezionare questi non avrebbe fallito nella fase n -esima. Ora sia y3 un qualsiasi membro di Δ2; allora Δ2 – ( y3 ) deve contenere una sottoclasse infinita Δ3 tale che tutte le ρ combinazioni costituite da y3 insieme con i ρ -1  membri di Δ3, appartengono alla stessa Ci, che, come prima, non può essere C1 e deve essere C2. E continuando in questo modo potremo evidentemente trovare due sequenze infinite y1 , y2, . . . , yn, . . . e Δ1 , Δ2 , . . . , Δn , . . . composti rispettivamente da membri delle sottoclassi di Γ , e tali che yn è sempre un membro di Δn-1, Δn una sotto- classe di Δn -1 che non include yn , e tutte le ρ combinazioni formate unendo yn ai ρ – 1 membri di Δn appartengono a C2; e se indichiamo con Δ la classe (y1 , y2, . . . , yn, . . .) abbiamo, dalla dimostrazione precedente, che tutte le ρ combinazioni dei membri del Δ appartengono a C2.

Quindi , in entrambi i casi , Γ contiene una sottoclasse infinita Δ del tipo richiesto, e il Teorema A è dimostrato per tutti i valori di r, purché μ = 2 . Per valori più elevati di μ lo dimostriamo per induzione; supponendolo già provato per μ = 2 e μ = ν -1, si deduce che per μ = ν .

Le r- combinazioni dei membri di Γ sono poi suddivise in ν classi Ci ( i = 1 , 2 , … , ν ) . Definiamo le nuove C’i per i = 1,2 , … , v- 1 con

C’i = Ci ( i = 1 , 2 , … , ν – 2 ) ,

C’ν – 1 = Cν – 1 + Cν

Quindi per il teorema per μ = ν – 1 , Γ deve contenere un sottoclasse infinita Δ tale che tutte le r- combinazioni dei membri di Δ appartengono alla stessa C’i . Se, in questa C’i , i ≤ ν – 2 , appartengono tutti alla stessa Ci, che è il risultato da dimostrare; altrimenti appartengono tutti alla C’ν – 1 , cioè o a Cν – 1 o Cν . In questo caso, per il teorema per μ = 2 , Δ deve contenere un infinita sottoclasse Δ’ tale che le r – combinazioni dei membri di Δ’ sia appartengono tutti o a Cν – 1 o appartengono tutti a Cν; e il nostro teorema è dimostrato.

Venendo ora a classi finite ci eviterà problemi il fare alcune convenzioni per la notazione. Lettere minuscole diversa da x e y, o in corsivo o lettere greche (per esempio n , r, μ , m ) , indicheranno sempre cardinali finiti, positivi se non diversamente specificato. Le lettere greche maiuscole (ad esempio Γ , Δ ) indicheranno le classi , e i loro suffissi indicheranno il numero dei loro membri (ad esempio Γm è una classe con m membri). Le lettere x e y rappresenteranno i membri delle classi Γ, Δ, ecc. , e i loro suffissi verranno utilizzati solo per distinguerli. Infine, la lettera C rappresenterà, come in precedenza, classi di combinazioni , e i suoi suffissi non faranno riferimento al numero dei membri, ma servono solo a distinguere le diverse classi di combinazioni considerate.

Corrispondente al Teorema A abbiamo poi

TEOREMA B. Dati qualsiasi r , n , e μ possiamo trovare un m0 tale che , se m ≥ m0 e le r- combinazioni di qualsiasi Γm sono divise in qualche modo in μ classi mutuamente esclusive Ci ( i = 1 . 2 .. μ ) , allora Γm deve contenere una sottoclasse Δn tale che tutte le r- combinazioni dei membri Δn appartengono alla stessa Ci.

Questo è il teorema di cui abbiamo bisogno nelle nostre indagini logiche, e sarebbe allo stesso tempo come avere informazioni su quanto grande deve essere preso m0 per qualsiasi dato r , n , e μ .

Non so come risolvere questo problema, e non ho dubbi che i valori di m0 ottenuti qui sotto sono molto più grandi di quanto sia necessario.

Per dimostrare il teorema cominciamo, come nel Teorema A , supponendo che μ = 2. Prendiamo poi, non il Teorema B in sé , ma l’equivalente:

TEOREMA C. Dati qualsiasi r , n , e k tali che n + k ≥ r, esiste un m0 tale che, se m ≥ m0 e le r- combinazioni di qualsiasi Γm sono divise in due classi mutuamente esclusive C1 e C2 , allora Γm deve contenere due sottoclassi mutualmente esclusive Δn e Λk tali che tutte le combinazioni formate dagli r membri di Δn + Λk che comprendono almeno un membro da Δn appartengono alla stessa Ci.

Che questo è equivalente al teorema B con μ = 2 è evidente dal fatto che, per qualsiasi r dato, il Teorema C, per n e k, asserisce più del Teorema B per n, ma meno del Teorema B per n + k.

La dimostrazione del Teorema C deve essere ottenuta per induzione matematica, e può essere convenientemente che sia presentata come una dimostrazione che è possibile definire ricorsivamente una funzione f (r , n , k) che servirà come m0 nel teorema.

Se r = 1, il teorema è evidentemente vero con m0 pari al maggiore di 2n – 1 e n + k, in modo che possiamo definire

f ( 1 , n , k) = max ( 2n – 1 , n + k) ( n ≥ 1 , k ≥ 0 ) .

Per gli altri valori di r definiamo f ( r , n , k) da formule ricorsive che coinvolgono una funzione ausiliaria g (r , n , k). Supponiamo che f (r – 1 , n , k) sia stata definita per un certo r – 1, e tutte le n, k tali che n + k ≥ r- 1 , allora la definiamo per r ponendo

f ( r,1,k ) = f ( r – 1, k -r + 2, r -2 ) +1       ( k + 1 ≥ r) ,

g ( r, 0, k) = max ( r-1, k ) ,

g (r , n , k) = f { r, 1 , g (r , n – 1 , k) } ( n ≥ 1 ) ,

f ( r , n , k) = f { r , n -1 , g (r , n , k) } ( n > 1 ) .

Si può vedere facilmente che queste formule definiscono f ( r , n , k) per tutti i valori positivi di r , n e k che soddisfano n + k ≥ r , e g ( r , n , k) per tutti i valori di r maggiori di 1, e tutti i valori positivi di n e k; e dimostreremo che il Teorema C è vero quando assumiamo m0 essere questo f ( r , n , k). Sappiamo che questo è così quando r = 1, e noi quindi lo assumeremo che per tutti i valori fino a r – 1 e lo dedurremo per r .

Quando n = 1 , e m ≥ m0 = f ( r – 1 , k – r + 2 , r – 2 ) + 1 , si può prendere qualsiasi membro x di Γm di essere unico membro di Δ1 e ci rimangono almeno f ( r – 1 , k – r + 2 , r – 2 ) membri di Γm – ( x ); le ( r – 1 ) – combinazioni di questi membri di Γm – ( x ) possono essere suddivisi nelle classi C’1 e C’2 in quanto appartengono a C1 o C2 quando x è aggiunto ad esse, e, dal nostro teorema perché r – 1 , Γm – ( x ) devono contenere due classi mutuamente esclusive Δk – r +2 , Λr – 2 tali che ogni combinazione di r -1 termini di ΔK -r +2 + Λr -2 ( in quanto uno dei suoi termini deve provenire da ΔK-r+2 , Λr -2 avendo solo r – 2 membri) appartiene alla stessa C’i . Assumendo che Λk sia questo ΔK – r +2 + Λr – 2 tutte le combinazioni costituite da x , unitamente a r -1 membri di Λk , appartengono alla stessa Ci. Il teorema è quindi vero per r quando n = 1 .

Per altri valori di n lo dimostriamo per induzione, assumendolo per n – 1 e deducendolo per n. Assumendo

m ≥ m0 = f ( r , n , k) = f { r , n – 1 , g (r , n , k ) } ,

Γm . deve , per il teorema per n -1, contenere un Δn – 1 e un Λg ( r,n , k ) tali che ogni combinazione degli r membri di Δn – 1 + Λg ( r, n , k ), almeno un termine dei quali deriva dalla Δn – 1, appartiene alla stessa Ci, ovvero a C1. Se , ora , Λg(r,n , k ) contiene un membro x e una sottoclasse Λk che non include x, tale che una qualsiasi combinazione di x e r-1 membri di Λk appartengono a C1, allora, assumendo che Δn sia Δn – 1 + ( x ) e Λk sia questo Λk , il nostro teorema è vero. Se no, non ci può essere nessun membro di Λg ( r,n , k) che ha una sotto- classe di k membri di Λg ( r,n , k) ad essa connessa in questo modo. Ma dal momento che

g (r , n , k) = f { r , 1 , g (r , n – 1 , k ) } ,

Λg ( r,n , k) deve contenere un membro x1 e una sottoclasse Λg ( r,n – 1 , k) , che non comprende x1, tale che x1 combinato con qualsiasi dei membri r – 1 di Λg ( r,n – 1 , k ) fornisce una combinazione appartenente alla stessa Ci, che non può essere C1, o x1 e qualsiasi k membri di Λg ( r,n – 1 , k) potrebbero essere presi come x andΛk di cui sopra.

Quindi le combinazioni formate da x1 insieme ogni membro r -1 di Λg ( r,n – 1 , k) appartengono tutti alla C2 . Ma adesso

g (r , n – 1 , k) = f { r , 1 , g (r , n – 2 , k ) } ,

e Λg ( r,n – 1 , k) deve contenere un x2 e un Λg ( r,n – 2 , k) , che non includono x2 , tale che le combinazioni formate da x2 e gli r -1 membri di Λg ( r,n – 2 , k) appartengono tutte alla stessa Ci, che deve, come prima, essere C2 , poiché x2 e Λg ( r,n – 2 , k) sono entrambi contenuti in Λg (r , n , k) e g ( r , n – 2 , k) ≥ k.

Continuando in questo modo possiamo trovare n termini distinti x1 , x2 , .. . , xn . e un Λg (r , 0 , k ) tale che ogni combinazione di termini r da (x1 , x2 , .. . , xn) + Λg (r , 0 , k ) appartiene a C2 , a condizione che almeno un termine della combinazione provenga da (x1 , x2 , .. . , xn) . Poiché g (r , 0 , k) ≥ k questo dimostra il nostro teorema, assumendo che Δn sia (x1 , x2 , .. . , xn) e Λk sia qualsiasi termine k di Λg (r , 0 , k) .

Il teorema C è quindi dimostrato per tutti i valori di r, n e k, con m0 pari a f ( r, n , k) . Ne consegue che, se μ = 2 , il Teorema B è vero per tutti i valori di r e n con m0 uguali a f ( r, n – r + 1 , r – 1 ) , che chiameremo anche h (r , n , 2 ) .

Per altri valori di μ dimostriamo il Teorema B per induzione, assumendo che m0 sia h ( r, n , μ ), dove

h (r , n , 2) = f ( r, n – r +1, r – 1 ) ,

h (r , n , μ) = h { r , h ( r, n, μ – 1 ) , 2} ( μ > 2) .

Perché, assumendo il teorema per μ – 1, lo dimostriamo per μ definendo nuove classi di combinazioni

C’1 = C1 ,

Schermata 2014-05-23 alle 19.09.08

Se allora m ≥ h (r , n , μ ) = h { r , h ( r , n , μ -1 ) , 2 } , per il teorema per μ = 2 , Γm deve contenere un Γh (r , n , μ -1 ) le combinazioni dei cui membri r appartengono o tutte a C’1 o tutte a C’2 . Nel primo caso non vi è più nulla da dimostrare, nel secondo dobbiamo solo applicare il teorema per μ – 1 a Γh (r , n , μ – 1 ) .

Nel caso più semplice in cui r = μ = 2 il ragionamento precedente fornisce m0 pari a h ( 2 , n , 2 ), che è facilmente dimostrato essere 2n ( n – 1 ) / 2 . Ma in questo caso vi è una semplice dimostrazione che fornisce il valore molto più basso m0 = n !, E dimostra che il nostro valore h (r , n , μ ) è del tutto eccessivo.

Perché, prendendo in primo luogo il Teorema C, siamo in grado di dimostrare per induzione con riferimento ad n che, per r = 2, possiamo assumere che m0 sia k. ( n + 1 ) ! . ( k è qui supposto maggiore o uguale a 1).

Perché questo è vero quando n = 1, dal momento che, se m ≥ 2k, di m – 1 coppie ottenute combinando un qualunque membro della Γm con gli altri, almeno k devono appartenere alla stessa Ci . Supponendo ciò, quindi, per n – 1, lo dimostriamo per n .

Se m ≥ k. ( n +1 ) ! = k ( n +1) . n ! , Γm deve, per il teorema per n -1, contenere due mutuamente esclusive sottoclassi Δn – 1 e Λk ( n +1), tali che tutte le coppie da Δn – 1 + Λk ( n +1 ), almeno un termine delle quali proviene da Δn – 1 , appartengono alla stessa Ci, ovvero a C1. Consideriamo ora i membri Λk ( n +1), in primo luogo, ci può essere uno di questi, ad esempio x, che è tale che ci sono k altri membri della Λk ( n +1) che, combinati con x danno coppie appartenenti a C1. Se è così , il teorema è vero, assumendo che Δn sia  Δn – 1 + ( x ); altrimenti sia x1 qualsiasi membro ofΛk ( n +1 ). Allora vi sono al più k- 1 altri membri di Λk ( n +1) che, combinati con x1 danno coppie appartenenti a C1, e Λk( n +1 ) – (x1) che devono contenere un Λkn qualsiasi membro del quale fornisce quando combinato con x1 una coppia appartenente a C2 . Sia x2 un qualsiasi membro di Λkn allora, dal momento che x2 e Λkn sono entrambi contenuti in Λk ( n +1), ci sono al massimo k – 1 altri membri della Λkn , che se combinati con x2 danno coppie appartenenti a C1 . Quindi Λkn -( x2 ) contiene un Λk ( n – 1) qualsiasi membro del quale combinato con x2 dà una coppia appartenente a C2. Continuando in questo modo otteniamo x1 , x2 , . . . , xn e Λk , tali che ogni coppia xi , xj e ogni coppia costituita da un xi ed un membro di Λk appartiene a C2.

Il Teorema C è quindi dimostrato.

Il Teorema B per n poi segue , con l’m0 del Teorema C per n – 1 e 1, cioè con m0 pari a n ! 1; ed è un’estensione facile mostrare che , se nel Teorema B r = 2, ma μ ≠ 2 , possiamo assumere che m0 sia n! ! ! . . . . , Dove il processo di prendere il fattoriale si verifica μ -1 volte.

1 Ma questo valore è, credo , ancora troppo elevato. Può essere facilmente abbassato leggermente anche quando seguendo la linea di ragionamento precedente, utilizzando il fatto che se k è pari è impossibile per ogni membro di una classe dispari di avere esattamente k -1 altri con i quali formi una coppia di C1, perché allora due volte il numero di queste coppie sarebbe dispari, possiamo quindi iniziare quando k è pari con un Λk ( n +1) -1 invece di un Λk ( n +1).

II

Ci occuperemo di formule logiche contenenti funzioni proposizionali variabili, ossia predicati o relazioni, che indicheremo con lettere greche φ , X , Ψ , ecc. Queste funzioni hanno come argomenti particolari indicati con x , y , z , ecc. , e ci occuperemo di funzioni con qualsiasi numero finito di termini, cioè di una qualsiasi delle forme

φ ( x ) , Χ ( x , y ) , Ψ ( x , y , z ) . ….

Oltre a queste funzioni variabili avremo una funzione costante di identità

x = y       o     = ( x , y ) .

Agendo sui valori di φ , Χ , Ψ , . . . ,  e l’= le operazioni logiche

~ significa non,

v significa o,

. significa e,

( x ) significa per tutti le x,

∃ x ) significa che c’è una x per la quale,

possiamo costruire espressioni come

[ ( x , y ) { φ ( x , y ) v x = y } ] { v ( ∃ z ) Χ ( z ) }

in cui tutte le variabili particolari sono rese ‘ apparenti ‘ dai prefissi ( x ) o ( ∃ x ), e le sole variabili reali restanti sono le funzioni φ , X , . . . Chiameremo una tale espressione formula di primo ordine.

Se tale la formula è vera per tutte le interpretazioni 1 delle variabili funzionali φ , Χ , Ψ , ecc. , noi la chiameremo valida, e se non è vera per nessuna interpretazione di queste variabili la chiameremo incoerente. Se è vera per alcune interpretazioni (anche se non per tutte) la chiameremo coerente.2

1 Per evitare confusioni noi chiamiamo una funzione costante sostituita ad un φ variabile, non un valore di φ, ma una interpretazione di essa; i valori di φ ( x , y , z) sono ottenuti sostituendo costanti particolari a x , y e z.

2 erfüllbar in tedesco .

L’Entscheidungsproblem (n.d.t.: il problema della decisione cfr. Hilbert) è di trovare un procedimento per determinare se una qualsiasi data formula è valida, o , in alternativa, se una qualsiasi data formula è coerente; perché questi due problemi sono equivalenti, dal momento che la condizione necessaria e sufficiente per una formula per essere coerente è che la sua contraddizione non sarebbe valida. Dovremo trovare più conveniente assumere il problema in questa seconda forma come indagine di coerenza. La coerenza di una formula può, ovviamente , dipendere del numero di particolari nell’universo considerato, e dovremo distinguere tra formule coerenti in ogni universo e quelle che sono coerenti solo in universi con certi particolari numeri di membri .

Ogni volta che l’universo è infinito dovremo assumere l’Assioma delle Selezioni .

Il problema è stato risolto da Behmann 1 per formule che coinvolgono solo le funzioni di una variabile, e da Bernays e Schönfinkel 2 per formule che coinvolgono due sole variabili particolari apparenti. E’ risolto qui sotto nell’ulteriore caso in cui, quando la formula è scritta in ‘ forma normale ‘, esistono un certo numero di prefissi di generalità ( x ) , ma nessuno di esistenza ( ∃ x ) .3 Con ‘ forma normale ‘ 4 qui si intende che tutti i prefissi si trovano all’inizio, con nessuna negazione tra o prima di essi, e hanno ambiti che si estendono fino al termine della formula.

1 H. Behmann , ” Beiträge zur Algebra der Logik , insbesondere zum Entscheidungsproblem, ” Math. Annalen , 86 (1922), pp 163-229 .

2 P. Bernays und M. Schönfinkel , “Zum Entscheidungsproblem der mathematiscen logik, “Math. Annalen, 99 (1928), pp. 342-372. Questi autori, tuttavia, non includono l’identità nelle formule che considerano.

3 Più avanti estendo la nostra soluzione al caso in cui ci siano anche prefissi di esistenza purché tutti questi precedano i prefissi di generalità.

4 Hilbert und Ackermann, op. cit., 63-64.

Le formule da considerare sono pertanto nella forma

(x1,x2, …, xn) F(ϕ,Χ,Ψ, …, = x1,x2, …, xn)

Dove la matrice F è una funzione verità dei valori delle funzioni ϕ,Χ,Ψ, ecc., e = per gli argomenti tratti da x1,x2, …, xn

Questo tipo di formula è interessante come il tipo generale di un sistema di assiomi interamente costituito da ‘ leggi generali ‘. 1

Gli assiomi per ordine, nello stare in relazione , e ordine ciclico sono tutti di questa natura , e noi stiamo tentando così una teoria generale della coerenza dei sistemi di assiomi di un tipo comune, se molto semplice.

Se l’identità non si verifica in F il problema è banale, poiché in questo caso se la formula è coerente o non può essere dimostrato che sia indipendente dal numero di particolari nell’universo, e abbiamo solo il facile compito di provarlo per un universo con un solo membro. 2

Ma quando si introduce l’identità il problema diventa molto più difficile, perché anche se è abbastanza evidente che, se la formula è coerente nell’universo U deve essere coerente in ogni universo con un minor numero di membri di U, ma può facilmente essere coerente in un più piccolo universo ma non in universo più ampio .

Per esempio ,

( x1 , x2 ) [ x1 = x2 v { φ ( x1 ) . ~ Φ ( x2 ) } ]

è coerente in un universo con un solo membro ma non in qualsiasi altro.

Iniziamo la nostra indagine esprimendo F in una forma particolare. F è una funzione verità dei valori di φ , Χ , Ψ , … e = per gli argomenti tratti da x1,x2, …, xn. Se φ è una funzione di r variabili ci saranno nr3 valori di φ che possono verificarsi in F e F sarà una verità funzione dei valori Σnr di φ , Χ , Ψ , … e = , che chiameremo proposizioni atomiche .

1 C.H. Langford , ” la completezza analitica degli insiemi postulati “, Proc. London Math. Soc. ( 2 ) , 25 ( 1926) , pp. 115-116 .

2 Bernays und Schönfinkel , op . cit . , p. 359 . Noi ignoriamo del tutto universi senza membri .

3 Qui e altrove i numeri sono riportati non in quanto sono rilevanti per l’argomento , ma per consentire al lettore di verificare che egli ha in mente la stessa classe di entità dell’autore.

Con riferimento a queste proposizioni atomiche Σnr ci sono 2Σnr possibilità di verità e falsità che chiameremo alternative, essendo ogni alternativa una congiunzione di Σnr proposizioni che sono o proposizioni atomiche o le loro contraddizioni. Nel costruire le alternative tutte le proposizioni atomiche Σnr devono essere utilizzate sia che si verifichino in F o meno. F può quindi essere espresso come una disgiunzione di alcune di queste alternative, cioè quelle con cui è compatibile.

E’ ben noto che tale espressione è possibile; anzi è il duale di quello Hilbert e Ackermann chiamano ‘ ausgezeichnete konjunktive Normalform (eccellente forma normale congiuntiva‘ , 1 ed è fondamentale anche nella logica di Wittgenstein. L’unica eccezione è quando F è una funzione di verità auto – contraddittoria, nel qual caso la nostra formula non è certamente coerente .

F essendo stato quindi espresso come una disgiunzione di alternative (nel nostro speciale significato della parola ), il nostro compito successivo è quello di mostrare che alcune di queste alternative possono essere in grado di essere eliminate senza incidere sulla coerenza o incoerenza della formula. Se tutte le alternative possono essere rimosse in questo modo la formula sarà incoerente; altrimenti dovremo ancora considerare le alternative che rimangono .

In primo luogo una alternativa può violare le leggi di identità contenendo parti di una qualsiasi delle seguenti forme : –

xi ≠ xi2

xi = xj.xj ≠ xi ( i ≠ j )

xi = xj.xj = xk . xi ≠ xk ( i ≠ , j ≠ k, k ≠ i) ,

o contenendo xi = xj ( i ≠ j ) e i valori di una funzione φ ed è contraddittoria ~ φ per un insieme di argomenti che diventano gli stessi quando xi è sostituito da xj [ad esempio x1 = x2 . φ ( x1 , x2 , x3) . ~ φ ( x1 , x2 , x3 ) ] .

1 op. cit . , p . 16 .

2 Noi scriviamo x ≠ y per ~ ( x = y) .

Qualsiasi alternativa che violi queste leggi deve essere sempre falsa e può evidentemente essere scartata senza compromettere la coerenza della formula. Le alternative rimanenti possono essere classificate in base al numero di x che rendono diverse, che può essere qualsiasi, da 1 fino a n.

Supponiamo che per un determinato alternativa questo numero è ν , allora possiamo trarre da questo ciò che chiameremo la corrispondente y alternativa dal seguente processo: –

Per x1, ovunque si manifesti nella data alternativa, si scrive y1; poi, se in alternativa a x2 = x1, per x2 si scrive di nuovo y1, se non si scrive y2 per x2. In generale, se xi è la data alternativa identica con qualsiasi xj con j minore di i, scrivo per xi la y precedentemente scritta per xj; altrimenti si scrive per xi , yk +1, dove k è il numero di y già introdotto. L’espressione che risulta contiene ν di y tutte diverse invece delle x di n, alcune delle quali sono identiche, e noi le chiameremo y alternative che corrispondono alla data x alternativa .

Così all’alternativa

φ ( x1 ) . ~ Φ (x2) . φ ( x3 ) . ~ φ (x4) . x1 = x3.x2 = x4.x1 ≠ x2 1

corrisponde l’alternativa y

φ ( y1 ) . ~ Φ ( y2 ) . y1 ≠ y2

Chiamiamo le due y alternative simili se contengono lo stesso numero di y e possono essere derivate l’una dall’altra permutando queste y, e noi chiamiamo due x alternative equivalenti se corrispondono a simili (o identiche) alternative y.

Così

φ ( x1 ) . ~ Φ (x2) . φ ( x3 ) . ~ φ ( x4 ) . x1 = x3.x2 = x4.x1 ≠ x2 ( α )

è equivalente a

~ Φ ( x1) . φ ( x2 ) . φ ( x3 ) . φ ( x4 ) . x1 ≠ x2.x2 = x3 = x4 ( β )

1 Prendiamo una funzione di una variabile solo per semplicità; anche per risparmiare spazio omettiamo espressioni che possono essere adottate per certe come x1 = x1 , x1 ≠ x4

in quanto corrispondono alle alternative y simili

φ ( y1 ) . ~ Φ ( y2 ) . y1 ≠ y2

~ Φ (y1) . φ ( y2 ) . y1 ≠ y2

derivabili una dall’altra scambiando y1 e y2 sebbene ( α ) e ( β ) non siano nello stesso modo derivabili permutando le x.

Ora vediamo che possiamo scartare ogni alternativa contenuta in F, qualora F contenga anche tutte le alternative equivalenti ad essa; ad esempio se F contiene ( α ) ma non ( β ), ( α ) può essere eliminata da questa. Perché omettendo le alternative chiaramente non può rendere la formula coerente se non lo era così prima; e possiamo facilmente dimostrare che, se fosse stata coerente prima, omettere queste alternative non potrebbero renderla incoerente.

Perché supponiamo che la formula sia coerente, cioè che per qualche particolare interpretazione di φ , Χ , Ψ , . . . F è vero per ogni insieme di x, e sia p un’alternativa contenuta in F, q un’alternativa equivalente a p, ma non contenuta in F.

Allora per ogni insieme di x una e una sola alternativa in F sarà (con questa interpretazione di φ , Χ , Ψ , ….) quella vera, e questa alternativa non può mai essere p. Perché se fosse p, la corrispondente alternativa y sarebbe vera per alcuni insiemi di y, e la simile alternativa y corrispondente a q sarebbe vera per qualche insieme di y ottenuto permutando questo ultimo insieme. Dando opportuni valori di x in termini di y di, q allora sarebbe vera per un certo insieme di x e F sarebbe falsa per di queste x in contrasto con le ipotesi. Quindi p non è mai la vera alternativa, e può essere omessa senza influenzare la coerenza della formula.

Quando abbiamo scartato tutte queste alternative di F, il resto cadrà in insiemi ciascuno dei quali è l’insieme completo di tutte le alternative equivalenti a una data alternativa. Ad un tale insieme di alternative x corrisponderà una serie completa di alternative y simili, e la disgiunzione di un insieme completo di alternative y simili (cioè di tutte le permutazioni di una data alternativa y ) chiameremo una forma. 1 Indicheremo una forma contenente ν di y con una maiuscola corsiva con suffisso ν, ad esempio, Aν Bν

La forza di una formula può essere rappresentata dalla seguente congiunzione, che chiameremo P:

Schermata 2014-02-05 alle 19.00.41 traduzione

dove Aν Bν 2 , ecc., sono le forme corrispondenti alle x alternative ancora rimaste in F. Se per qualsiasi ν ≤ n non ci sono tali forme, cioè se non esistono alternative a ν diversi x rimangono in F, la nostra formula implica che non vi sono oggetti come ν particolari distinti, e quindi non può essere coerente in un mondo ν o più membri.

1 Cf . Langford , op . cit . , 116-20 .

2 La notazione è parzialmente fuorviante , dal momento che Aν non ha una più stretta relazione con a Aμ rispetto a Bμ .

Ora dobbiamo definire cosa si intende dicendo che una forma è coinvolta in un’altra. Si consideri una forma Aν e prendiamo una delle alternative y in essa contenuta . Questo y alternativa è un insieme di valori di φ , Χ , Ψ , . . . e le loro contraddittorie per gli argomenti tratti dalla y1 , y2 , . . . , yν (potremmo lasciare fuori i valori di identità e differenza, dal momento che è dato per scontato che le y sono sempre differenti.) Se μ < ν possiamo selezionare un μ di questi y in qualche modo e lasciare fuori dall’alternativa tutte i termini in essa che contengono qualsiasi y non selezionati di ν-μ. Abbiamo lasciato una alternativa y in μ che possiamo rinumerare y1 , y2 , . . . yμ e possiamo descrivere la forma Eμ a cui questa nuova alternativa appartiene come coinvolta nella Aν da cui abbiamo iniziato. Partendo da un particolare y alternativo in Aν possiamo ottenere un gran numero di differenti Eμ scegliendo in modo diverso la μ di y che selezioniamo per riservarla; e da qualsiasi y alternativo in Aν cominciamo, l’Eμ che troviamo essere coinvolto in Aν sarà lo stesso .

Per esempio ,

{ φ ( y1 , y1 ) . φ ( y1 , y2 ) . φ ( y2 , y1 ) . ~ Φ ( y2.y2 ) } v { ~ Φ ( y1 , y1 ) . φ ( y1 , y2 ) . φ ( y2 , y1 ) . Φ ( y2 ,y2 ) }

è una forma A2 che coinvolge le due E1 di

φ ( y1 , y1 ) ,

~ Φ ( y1 , y1 ) .

E ‘chiaro che se per qualche insieme distinto di ν di y una forma Aν è vera, allora ogni forma Eμ coinvolta in Aν sarà vera per alcuni distinti insiemi di μ di y contenuti nel ν.

Siamo ora in grado di risolvere la coerenza o l’ incoerenza della nostra formula quando N, il numero di particolari nell’universo, è inferiore o uguale a n, il numero di x nella nostra formula. Infatti , se N ≤ n , è necessario e sufficiente per la coerenza della formula che P deve contenere una forma AN insieme con tutte le forme Eμ coinvolte in esso per ogni μ minore di N.

Questa condizione è evidentemente necessaria, dal momento che gli individui N nell’universo lo devono, assunto che y1 , y2 , . . . yN, abbiano una qualche forma AN rispetto a qualsiasi φ , Χ , Ψ , . . . ; e tutte le forme coinvolte in questo AN devono essere vere per le diverse selezioni di y, e così contenute in P se P deve essere vera per queste φ , Χ , Ψ , . . ..

Viceversa, supponiamo che P contenga una forma AN insieme a tutte le forme coinvolte in AN; allora chiamando gli N particolari nell’universo y1, y2 , . . . yN, possiamo definire che le funzioni φ , Χ , Ψ , . . . che rendono qualsiasi assegnata alternativa y in AN vera; perché ogni permutazione di questi N di y sarà un’altra alternativa in AN vera, e per qualunque sottoinsieme di y qualche alternativa y è una forma coinvolto in AN. Poiché tutte queste alternative y sono per ipotesi contenuta in P, P sarà vera per questi φ , Χ , Ψ , . . . , e la nostra formula coerente.

Quando, tuttavia, N > n il problema non è così semplice, anche se dipende chiaramente dalle AN in P tale che tutte le forme coinvolte in essa sono contenute anche in P. Possiamo definire queste  An come completamente contenute in P, e se non ci sono tali An una dimostrazione simile a quella utilizzata quando N ≤ n mostrerà che la formula è incoerente. Ma l’argomento opposto, che se c’è una AN completamente contenuta in P la formula deve essere coerente, non può essere sostenuta bene; e per procedere oltre dobbiamo introdurre una nuova concezione , la concezione di una forma che sia seriale.

Ma prima di procedere a spiegare questa idea è meglio semplificare la questione con l’introduzione di nuove funzioni. Sia φ essere una delle funzioni variabili nella nostra formula, con, ad esempio, r termini. Allora se r < n , φ si presenta in P , con tutti i suoi diversi argomenti [ad esempio φ ( y1 , y2 , … , yr )] e anche con alcuni di questi uguali [ad esempio φ ( y1 , y2 , … , yr – 1 , y1 )]; ma possiamo opportunamente eliminare i valori del secondo tipo con l’introduzione di nuove funzioni con meno argomenti di r, che, quando tutti i loro termini sono diversi, assumono i valori equivalenti a quelli di φ con alcuni dei suoi argomenti identici .

Ad esempio possiamo mettere

φ1 ( y1 , y2 , … , yr – 1 ) = φ ( y1, y2, … , yr – 1 , y1) .

In questo modo φ dà luogo ad un grande numero di funzioni con un numero minore di argomenti; noi definiamo ciascuna di queste funzioni solo per il caso in cui tutti gli argomenti sono diversi, come è garantito da questi argomenti essendo differenti i suffissi di y.

Se r > n , non vi è alcuna differenza, tranne che φ non può mai verificarsi con tutti i suoi argomenti diversi , e così è interamente sostituita dalle nuove funzioni.

Se facciamo questo per tutte le funzioni φ , Χ , Ψ , . . . , e le sostituiamo con le nuove funzioni ovunque si verifichino in P con alcuni dei loro argomenti della stessa, P conterrà una nuova serie di funzioni variabili (compresi tutte le vecchie che non hanno più di n argomenti), e questi non si presenteranno mai in P con lo stesso argomento ripetuto.

È facile vedere che questa trasformazione non influisce sulla coerenza della formula, perché, se era coerente prima, deve essere coerente in seguito, poiché le nuove funzioni devono semplicemente essere sostituite dalle loro definizioni. E se è coerente dopo deve essere state così prima, dal momento che a qualsiasi funzione del vecchio insieme deve solo essere dato per qualsiasi insieme di termini il valore dell’opportuna funzione del nuovo insieme. 1

In considerazione di questo fatto troveremo più conveniente prendere P nella sua nuova forma , e indicare il nuovo insieme di funzioni con φ0 , Χ0 , Ψ0 , . . .

1 Per esempio , se φ ( y1 , y2 , y3 ) è una funzione del vecchio insieme, abbiamo cinque nuove funzioni

φ0 ( y1 , y2 , y3) = φ ( y1 , y2 , y3 )

Χ0 ( y1 , y2 ) = φ ( y1 , y1 , y2 )

Ψ0 ( y1 , y2 ) = φ ( y1 , y2 , y1 )

π0 ( y1 , y2 ) = φ ( y2 , y1 , y1 )

ρ0 (y1) = φ ( y1 , y1 , y1 )

e ogni valore di φ è equivalente ad un valore di una, e solo una , delle nuove funzioni. Va ricordato che le nuove funzioni sono usate solo con tutti i loro argomenti diversi; perché altrimenti non sarebbero indipendenti, dal momento che dovremmo avere , per esempio, Χ0 ( y1 , y1 ) equivalente a ρ0 ( y1 ) . Ma Χ0 ( y1 , y1 ) non si verifica mai, e φ ( y1 , y1 , y1 ) è equivalente non a qualsiasi valore di Χ0 ma solo a ρ0 ( y1 ) .

Supponiamo, poi, che φ0 sia funzione di r variabili; ci saranno

n ( n – 1 ) , .. ( n -r +1 )

valori di φ0 con r diversi argomenti tratti dalla y1 , y2 , . . . , yn e ogni y alternativa deve contenere ciascuno di questi valori o suoi contrari. r ! di questi valori avrà come argomenti le permutazioni di y1 , y2 , . . . , yr . Qualsiasi altra serie di r di y può essere organizzata secondo l’ordine dei loro suffissi come yS1 , yS2 . . . , ySr , s1 < s2 < s3 . , . . . < sr e può accadere che una data un’alternativa contenga i valori di φ0 per quelle e solo quelle permutazioni di yS1 , yS2 , . . . , ySr che corrispondono (in modo ovvio ) alle permutazioni di y1 , y2 , . . . , yr , per le quali (l’alternativa) contiene i valori di φ0; ad esempio se l’alternativa contiene φ0 ( y1 , y2 , … , yr ) e φ0 ( yr , yr – 1 , … , y1 ), ma per ogni altra permutazione di y1 , y2 , . . . , yr , contiene il valore corrispondente di ~ φ0 , allora può accadere che l’alternativa contenga φ0 (yS1 ,yS2 , … ,ySr ) e φ0 ( ysr , ysr – 1 , … , yS1 ), ma per ogni altra permutazione di yS1 , yS2 , . . . , ySr , contenga il valore corrispondente di ~ φ0.

Se questo accade, non importa come venga scelto l’insieme di r di y , yS1 , yS2 , . . . , ysr, da y1 , y2 , . . . , yn , allora diciamo che l’alternativa è seriale in φ0 , 1 e se un alternativa è seriale in ogni funzione del nuovo insieme la chiameremo semplicemente seriale .

1 Così , se φ0 è un . funzione di n variabili , tutte le alternative sono seriali in φ0.

Si consideri, per esempio , la seguente alternativa, in cui possiamo immaginare φ0 e Ψ0 che derivino da una ‘vecchia’ funzione φ con le definizioni

φ0 ( yi , yk ) = φ ( yi , yk ) .

Ψ0 ( yi ) = φ ( yi , yi ).

φ0 ( y1 , y2 ) . ~ Φ0 ( y2 , y1 ) . φ0 ( y1 , y3 ) . ~ Φ0 ( y3 , y1 ) . φ0 ( y2 , y3 ) . ~ Φ0 ( y3 , y2 ) ,

Ψ0 ( y1 ) . ~ Ψ0 ( y2 ) . Ψ0 ( y3 ) .

Questa è seriale in φ0, dal momento che abbiamo sempre φ0 (yS1 ,yS2 ) . ~ Φ0 (yS2 ,yS1 ); ma non in Ψ0 , dal momento che a volte abbiamo Ψ0 (yS1 ), ma a volte ~ Ψ0 (yS1 ). Quindi non è un’alternativa seriale .

Chiamiamo una forma seriale quando contiene almeno una alternativa seriale, e ora possiamo affermare il nostro risultato principale come segue.

TEOREMA – Dato un numero finito m, dipendente da n, il numero di funzioni φ , Χ , Ψ , . . . , e il numero dei loro termini, in modo tale che la condizione necessaria e sufficiente per la nostra formula di essere coerente in un universo con m o più membri è che ci dovrebbe essere una forma seriale An completamente contenuta in P. Per coerenza in un universo con un numero di membri inferiore ad m questa condizione è sufficiente ma non necessaria .

Noi in primo luogo dimostreremo che, qualunque sia il numero N di particolari nell’universo, la condizione è sufficiente per la coerenza della formula. Se N ≤ n, questa è una conseguenza del risultato precedente, poiché , se An è contenuto totalmente in P, allora qualunque AN è coinvolto in An.

Se N > n , noi supponiamo l’universo ordinato in una serie da una relazione R. ( Se N è infinito questo richiede l’Assioma delle Selezioni.) Sia q qualsiasi alternativa seriale contenuta in An.

Se φ0 è una funzione di r termini, q conterrà i valori o di φ0 o ~ φ0 ( ma non entrambi ) per ogni permutazione di y1 , y2 , . . . , yr. Qualsiasi di tali permutazioni possono essere scritte yρ1 , yρ2 , . . . , yρr , dove ρ1 , ρ2 , . . . , ρr sono 1 , 2 , . . . , r riordinati. Facciamo un elenco di tutte quelle permutazioni ( ρ1 , ρ2 , … , ρr ) in cui q contiene i valori di φ0, e chiamiamo questo elenco Σ. Diamo ora a φ0 la costante interpretazione che φ0 (z1, z2 … , zr ) deve essere vero se e solo se l’ordine dei termini z1, z2 … , zr  nella serie R è dato da una delle permutazioni (ρ1 , ρ2 , … , ρr) contenute in Σ , nel senso che, per ogni i , zi è l’ ρi– esimo di z1, z2 … , zr, in quanto sono ordinati per R.

Supponiamo ora che y1 , y2 , . . . , yn . siano numerati nell’ordine in cui si verificano in R , cioè che nella serie R y1 è il primo di essi , y2 il secondo , e così via. Allora vedremo che, se a φ0 viene data l’interpretazione costante sopra definita, tutti i valori di φ0 e ~ φ0 in q saranno veri. Infatti , per i valori cui argomenti sono ottenuti permutando  y1 , y2 , . . . , yr ciò segue subito dal modo in cui φ0 è stato definito. Perché φ0 ( yσ1 , yσ2 , … , yσr ) è vero se e solo se l’ordine di yσ1 , yσ2 , … , yσr nella serie R è dato da una permutazione ( ρ1 , ρ2 , … , ρr) contenuta in Σ. Ma l’ordine nella serie di yσ1 , yσ2 , … , yσr è infatti dato (in base alla nostra ipotesi presente che l’ordine della y è y1 , y2 , … , yr ) da ( σ1 , σ2 , … , σr ) , che è contenuto in Σ se e solo se φ0 ( yσ1 , yσ2 , … , yσr) è contenuto in q. Quindi i valori di φ0 per gli argomenti consistenti nei primi r di y sono veri quando sono contenuti in q e falsi in caso contrario, cioè quando i corrispondenti valori di ~ φ0 sono contenuti in q.

Per l’insieme di argomenti non contenuti nei primi y di r il nostro risultato deriva dal fatto che q è seriale, vale a dire che se s1 < s2 < . . . < sr così che yS1 , yS2 , . . . , ysr sono nell’ordine dato dalla serie R, q contiene i valori di φ0 proprio per quelle permutazioni di yS1 , yS2 , . . . , ysr che corrispondono alle permutazioni di y1 , y2 , . . . , yr per cui contiene i valori di φ0, ossia nella definizione di φ0 e per l’argomento precedente, proprio per quelle permutazioni di yS1 , yS2 , . . . , ysr, che rendono φ0 vero.

Quindi tutti i valori di φ0 e ~ φ0 in q sono vere quando y1 , y2 , . . . , yn sono nell’ordine dato dalla serie R.

Se, poi, definiamo analoghe interpretazioni costanti per Χ0 , Ψ0 , ecc , e combiniamo queste con la nostra interpretazione di φ0, l’insieme di q sarà vero ammettendo che y1 , y2 , . . . , yn sono nell’ordine dato dalla serie R, e se y1 , y2 , . . . , yn sono in qualsiasi altro ordine l’alternativa vera verrà ottenuta da q opportunamente permutando le y, cioè sarà un’alternativa simile a q e contenuta nella stessa forma An. Quindi An è vero per qualsiasi insieme distinto di y1 , y2 , . . . , yn. Inoltre, per ogni insieme di distinto y1 , y2 , . . . , yn , ( ν < n) la forma vera sarà una forma coinvolta in An, e dal momento che An e tutte le forme coinvolte in esso sono contenute in P, P sarà vero per queste interpretazioni di φ0 , Χ0 , Ψ0 , . . . , e la nostra formula deve essere coerente.

Avendo così dimostrato la nostra condizione di coerenza sufficiente in qualsiasi universo, dobbiamo ora dimostrare la necessità, in ogni universo infinito o finito sufficientemente grande, e per questo dobbiamo usare il Teorema B dimostrato nella prima parte del documento .

La nostra linea di ragionamento è la seguente: dobbiamo dimostrare che, qualunque φ0 , Χ0 , Ψ0 , . . . , prendiamo , P sarà falso a meno che contenga completamente un An seriale. Per questo è sufficiente dimostrare che, dati qualsiasi φ0 , Χ0 , Ψ0 , . . . , ci deve essere un insieme di n di y per cui la forma vera è seriale 1 o , poiché una forma seriale è quella che contiene un’alternativa seriale, che ci deve essere un insieme di valori di y1 , y2 , . . . , yn per cui l’alternativa vera è seriale.

Supponiamo che tra le nostre funzioni φ0 , Χ0 , Ψ0 , . . . esistano a1 funzioni di una variabile, a2 di due variabili , . . . , e an di n variabili, e che ordiniamo l’universo con una relazione seriale R.

Gli N termini nell’universo sono divisi dalle funzioni a1 di una variabile in 2a1 classi a seconda che rendano queste funzioni vere o false, e se N ≥ 2a1k1 , possiamo trovare k1 termini che appartengono tutti alla stessa classe, vale a dire che si accordano a quelle funzioni di a1 che le rendono vere e a quelle che le rendono false, dove k1 è un numero intero positivo da assegnare successivamente.

Chiamiamo questo insieme di individui k1 Γk1 .

1Perché allora P può essere vero solo per φ0 , Χ0 , Ψ0 , . . . nel contenere completamente tale forma seriale vera.

Ora consideriamo qualsiasi due membri distinti di Γk1 , diciamo z1 e z2, e poniamo che z1 precede z2 nella serie R . Allora in relazione a qualsiasi delle funzioni a2 di due variabili, diciamo φ0, ci sono quattro possibilità . Possiamo avere

( 1 ) φ0 ( z1 , z2 ) . φ0 ( z2 , z1 ) ,

o ( 2 ) φ0 ( z1 , z2 ) . ~ φ0 ( z2 , z1 ) ,

o ( 3 ) ~ φ0 ( z1 , z2 ) . φ0 ( z2 , z1 ) ,

o ( 4 ) ~ φ0 ( z1 , z2 ) . ~ φ0 ( z2 , z1 ) .

φ0 divide così le combinazioni a due a due dei membri di Γk1 in quattro classi distinte in base a quale di queste quattro possibilità si verifica a seconda di quali di queste quattro possibilità si verifica quando si assume la combinazione come z1, z2 nell’ordine in cui i suoi termini si verificano nella serie R; e l’intero insieme delle funzioni a2 di due variabili divide le combinazioni a due a due dei membri di Γk1 in 4a2 classi, essendo le combinazioni in ciascuna classe in accordo nella possibilità che esse soddisfino con riferimento a ciascuna funzione a2. Quindi , per il Teorema B , se k1 = h ( 2 , k2 , 4a2 ), Γk1 deve contenere una sottoclasse Γk2 di k2 membri tale che tutte le coppie di Γk2 concordano nelle possibilità che soddisfino in relazione a ciascuna funzione di due variabili a2.

Continuiamo a ragionare nello stesso modo secondo la seguente forma generale: –

1 Se ar = 0 si interpretano h (r , kr , 1) come kr e rendono identici Γkr -1 e Γkr.

Consideriamo qualsiasi r distinti membri di Γkr -1; supponiamo che nella serie R essi abbiano l’ordine z1 , z2 , . . . , zr. Allora con riferimento a qualsiasi funzione di r variabili esistono 2r! possibilità in riferimento a z1 , z2 , . . . , zr, e le ar funzioni di r variabili dividono le combinazioni r ad alla volta dei membri del Γkr – 1 in 2r!ar classi. Per il Teorema B , se kr- 1 = h (r , kr, 2r!ar ) , 1 Γkr – 1 deve contenere una sottoclasse Γkr , di kr membri tale che tutte le combinazioni r alla volta dei membri del Γkr concordano nelle possibilità che esse concordino rispetto a ciascuna delle ar funzioni di r variabili.

Si procede in questo modo fino a raggiungere Γkr – 1 , tutte le combinazioni n – 1 alla volta dei cui membri concordano nelle possibilità che soddisfino in relazione a ciascuna delle an- 1 funzioni di n – 1 variabili. Noi allora stabiliamo che kn – 1 deve essere uguale a n, che determina kn -2 come h ( n – 1 , n , 2 ( n – 1 ), an – 1 ) e così via indietro fino a k1 , ogni kr – 1 essendo definito da kr .

Se, dunque , N ≥ 2a1k1 , l’universo deve contenere una classe Γkn – 1 o Γn ( dal momento che kn – 1 = n ) di n elementi che sono contenuti nella Γkr per ogni r ( r = 1 , 2 , … , n -1 ). Siano i suoi n membri, nell’ordine dato loro da R , y1 , y2 , . . . , yn . Allora per ogni r minore di n , y1 , y2 , . . . , yn sono contenuti in Γkr e tutte le r combinazioni di queste concordano nelle possibilità che soddisfino con riferimento a ciascuna funzione di r variabili. Siano ys1, ys2, …,ysr ( s1 < s2 < … < sr ) una tale combinazione , e Χ0 una funzione di r variabili. Allora ys1, ys2, …,ysr sono nell’ordine dato loro da R, e così sono y1 , y2 , . . . , yr; di conseguenza il fatto che queste due combinazioni concordano nelle possibilità che esse realizzano rispetto a Χ0 significa che Χ0 è vero per le stesse permutazioni di ys1, ys2, …,ysr come è di y1 , y2 , . . . , yr. La alternativa vera per y1 , y2 , . . . , yn è quindi seriale in Χ0, e allo stesso modo è seriale in ogni altra funzione di qualsiasi numero di variabili r 1; ed è pertanto un’alternativa seriale .

1 Abbiamo dimostrato questo, quando r < n , possiamo anche avere r = n , ma allora non c’è nulla da dimostrare in quanto in una funzione di n variabili ogni alternativa è seriale.

La nostra condizione è , dunque, dimostrata essere necessaria in qualsiasi universo di almeno 2a1k1, membri dove k1 è dato da

Schermata 2014-02-07 alle 08.12.49 traduzione

Per universi compresi tra n e 2a1k1 non abbiamo trovato una condizione necessaria e sufficiente per la coerenza della formula, ma è evidentemente possibile determinarla per tentativi se una data formula è coerente in uno qualsiasi di tali universi.

III

Considereremo ora come diventano i nostri risultati quando la nostra formula

( x1 , x2 , … , xn ) F ( φ , X , Ψ , … , = , x1 , x2 , … , xn)

contiene oltre all’identità una sola funzione φ di due variabili .

In questo caso abbiamo due funzioni φ0 , Ψ0 date da

φ0 ( yi , yk ) = φ ( yi , yk ) ( i ≠ k) ,

Χ0 ( yi ) = φ ( yi , yi ) ,

così che a1 = 1 , a2 = 1 , ar = 0 quando r > 2 . Di conseguenza,

k2 = k3 = … = kn- 1 = n e k1 = h (2, n , 4) ;

ma l’argomento alla fine della parte prima mostra che possiamo prendere invece k1 = n ! ! ! , e la nostra condizione necessaria e sufficiente per la coerenza si applica a qualsiasi universo con almeno 2 . n ! ! ! particolari.

In questo semplice caso possiamo presentare la nostra condizione in una forma più evidente come segue.

È necessario e sufficiente per la coerenza della formula che sia vera quando φ è sostituito da almeno uno dei seguenti tipi di funzioni: –

( 1 ) La funzione universale x = x . y = y .

( 2 ) La funzione nulla x ≠ x . y ≠ y .

( 3 ) Identità x = y .

( 4 ) Differenza x ≠ y .

( 5 ) Una funzione seriale che ordini l’intero universo in una serie ,ossia che soddisfa

( a) ( x ) ~ φ ( x, x ) .

( b ) ( x , y ) [ x = y v { φ ( x , y ) . ~ Φ ( x, y ) } v { φ ( x, y. ) . ~ φ ( x , y ) } ] .

( c ) ( x , y . z ) { ~ φ ( x, y ) v ~ φ ( y, z ) v φ ( x , z ) } .

( 6 ) Una funzione che ordini l’intero universo in una serie, ma che contenga anche tra gli altri membri sé stessa, cioè che soddisfi

(a ‘ ) ( x ) φ ( x , x )

e ( b ) e ( c ) come in ( 5 ) .

I tipi da ( 1 ) a ( 4) comprendono una sola funzione ciascuno; per quanto riguarda i tipi ( 5 ) e ( 6) , è irrilevante il tipo di funzione che assumiamo, dato che se si soddisfa la formula così, possiamo vedere che soddisfa tutte le altre.1

1 Un risultato ottenuto in precedenza per il tipo ( 5 ) da Langford , op. cit.

Dobbiamo dimostrare questa nuova forma della nostra condizione, mostrando che P conterrà completamente un seriale An se e solo se è soddisfatto dalle funzioni di almeno uno dei nostri sei tipi. Ora un’alternativa in  n di y è seriale in Χ0 se contiene

Schermata 2014-02-07 alle 09.22.00 traduzione

ma non altrimenti , e sarà seriale in φ0 se contiene

Schermata 2014-02-07 alle 09.22.08 traduzione

Ci sono quindi complessivamente otto alternative seriali sia per φ0 e Χ0 ottenute combinando uno di ( i) , ( ii ) con qualsiasi di ( a) , ( b ) , ( c) , ( d ); ma queste alternative seriali otto danno origine solo a sei forme seriali, poiché le alternative ( i) (b) e ( i) ( c ) possono essere ottenute l’una dall’altra invertendo l’ordine della y e quindi appartengono alla stessa forma, e così accade per le alternative ( ii ) ( b ) e ( ii ) ( c ).

E’ anche facile vedere che qualsiasi formula contenente esclusivamente una di queste sei forme seriali verrà soddisfatta da tutte le funzioni di uno dei sei tipi secondo lo schema

forma                 ( i) ( a)       (i ) ( b e c )         (i ) ( d )      ( ii ) ( a)        ( ii ) ( b e c)        ( ii ) ( d )

Tipo di funzione    1                6                         3                 4                 5                         2

e che viceversa una formula soddisfatta da una funzione di uno dei sei tipi devono contenere esclusivamente la forma corrispondente. Per esempio , una funzione del tipo 6 soddisferà l’alternativa ( i) ( b ) quando y1 , y2 , . . . , yn sono nel loro ordine nella serie determinata dalla funzione, e quando y1 , y2 , . . . , yn sono in qualsiasi altro ordine che la funzione soddisferà un’alternativa della stessa forma.

Nel linguaggio della teoria dei sistemi postulato possiamo interpretare il nostro universo come una classe K, e concludere che un sistema postulato su una base ( K , R ) costituita esclusivamente da leggi generali che coinvolgono al massimo n elementi sarà compatibile con K avente tanti  membri  quanti 2 . n ! membri se e solo se può essere soddisfatta da una R di uno dei sei tipi .

IV

In conclusione , indichiamo brevemente come estendere il nostro metodo per determinare la coerenza o l’incoerenza delle formule del tipo più generale

( ∃ z1, z2 , … , zm ) ( x1 , x2 , … , xn ) F ( φ , Χ , Ψ , … , = , z1, z2 , … , zm , x1 , x2 , … , xn)

che hanno nella forma normale entrambi i tipi di prefisso, ma soddisfano la condizione che tutti i prefissi di esistenza precedono tutti quelli di generalità .

Come prima , possiamo supporre F rappresentato come una disgiunzione di alternative e scartare quelle che violano le leggi di identità. Possiamo raggruppare quelle rimaste in base ai valori di identità e differenza per argomenti tratti completamente dalle z . Possiamo definiamo tale insieme di valori di identità e differenza con Hi ( = , z1, z2 , … , zm ) , e F può essere messo nella forma

( H1 . F1 ) v ( H2 . F2 ) v ( H3 . F3 ) v … ,

e l’intera formula è equivalente a una disgiunzione di formule.

( ∃ z1, z2 , … , zm ) { H1 ( = , z1, z2 , … , zm ) . ( x1 , x2 , … , xn ) F1 ( φ , … , = z1 , … , zm , x1 , … , xn ) } v ( ∃ z1, z2 , … , zm ) { H2 ( = , z1 , … , zm ) . ( x1 , x2 , … , xn ) F2 ( φ , …. , = , z1 , … , zm , x1 , … , xn) } v ecc

Dal momento che se una qualsiasi di queste formule è coerente è coerente la sua disgiunzione, e se la sua disgiunzione è una coerente, almeno uno dei suoi termini deve essere coerente, è sufficiente per noi di mostrare come determinare la coerenza di uno di essi, diciamo il primo.

In questo H1 ( = , z1, z2 , … , zm ) è un insieme coerente di valori di identità e differenza per ogni coppia di z. Rinumeriamo le z z1 , z2 , …. , zμ utilizzando lo stesso suffisso per ogni insieme di z che sono identici in H1, e la nostra formula diventa

( ∃ z1, z2 , … , zμ ) ( x1 , x2 , … , xn ) F1 ( φ , Χ … , = z1, z2 , … , zμ , x1 ,.. , xn ) , (i )

in cui si comprende che due di z con differenti suffissi sono sempre diverse.

Ora, supponendo che l’universo abbia almeno μ + n elementi, consideriamo le diverse possibilità per quanto riguarda le x di essere identiche alle z, e riscriviamo la nostra formula

Schermata 2014-02-07 alle 09.48.06

in cui ⊃ significa ‘ se , allora’ e

G ( φ , … , xn) = Π F1 ( φ , Χ , … , = , z1 , … zμ , θ1 , θ2 , …. θn ) ,

il prodotto essendo assunto da

θ1 = x1 , z1, z2 , . . . , zμ ,

θ2 = x2 , z1, z2 , . . . , zμ ,

……. ….

θn = xn , z1, z2 , . . . , zμ ,

e in G qualsiasi termine xi = zj è sostituito da una falsità (ad esempio xi ≠ xi ) che non comprende nessun z .

Quindi modifichiamo G introducendo nuove funzioni. In G si verificano i valori di, ad esempio φ , con argomenti alcuni dei quali alcuni sono z e alcuni x; da questi si definiscono le funzioni delle x solo semplicemente considerando le z come costanti, e chiamiamo queste nuove funzioni φ0 , Χ0 , . . .. Sostituiamo i valori di φ , Χ , Ψ , . . . , che non comprendono nessuna x tra i loro argomenti, con le proposizioni costanti p , q , . . . Gli unici valori di identità in G sono nella forma xi = xj e lasciamo solo questi. Supponiamo che da questo processo G diventi

L ( φ , Χ , Ψ , … , φ0 , Χ0 , …. , p , q , … , = , x1 , x2 , … , xn) .

Allora la coerenza della formula ( i) in un universo di N termini è evidentemente equivalente alla coerenza in un universo di N – μ termini della formula

( x1 , x2 , … , xn ) L ( φ , Χ , Ψ , … , φ0 , Χ0 , …. , p , q , … , = , x1 , x2 , … , xn)

Ma questa è una formula del tipo precedentemente affrontato, ad eccezione delle proposizioni variabili p , q , . . . , che sono facilmente eliminate considerando i diversi casi della loro verità e falsità, essendo la formula coerente se è coerente in uno di questi casi .

Mathematical Logic – Parte II di The Foundation of Mathematics di Frank P. Ramsey

18 Mag

Come si suonano gli elettoriPropongo la mia traduzione della seconda parte delle opere pubblicate di Frank Plumpton Ramsey curate da R.B. Braithwaite con il titolo The Foundation of Matematics

LOGICA MATEMATICA ( 1926)

Mi è stato chiesto di parlare degli sviluppi nella Logica Matematica fin dalla pubblicazione dei Principia Mathematica, e penso che sarebbe stato più interessante se, invece di descrivere i vari precisi miglioramenti nel dettaglio, parlassi a grandi linee sul lavoro che è stato fatto con metodi completamente diversi, e che sostiene di sostituire del tutto la posizione assunta da Whitehead e Russell sulla natura della matematica ed i suoi fondamenti logici .

Permettetemi di cominciare ricordando quale è il punto di vista Whitehead e Russell: questo è che la matematica è parte della logica formale, che tutte le idee della matematica pura possono essere definite in termini che non sono tipicamente matematici, ma coinvolti nel pensiero complicato di una qualsiasi descrizione, e che tutte le proposizioni della matematica possono essere dedotte da proposizioni della logica formale, come ad esempio che se p è vero, allora o p o q è vero. Questo punto di vista mi sembra di per sé plausibile, così non appena la logica è stata sviluppata oltre il suo antico nucleo sillogistico, dovremo aspettarci di avere oltre alle forme ” Tutti gli uomini sono mortali ‘, ‘ Alcuni uomini sono mortali ‘, le forme numeriche ‘ Due uomini sono mortali ‘e’ Tre uomini sono mortali’, e i numeri dovranno essere inclusi nella logica formale.

Frege fu il primo a sostenere che la matematica faceva parte della logica, e a costruire una teoria dettagliata su tali basi.

Ma è entrato in collisione con le famose contraddizioni della teoria degli aggregati, e sembrava che le conseguenze contraddittorie potessero essere dedotte dalle sue proposizioni primitive. Whitehead e Russell sfuggirono a questo destino introducendo la Teoria dei Tipi , di cui è impossibile dare qui un resoconto adeguato. Ma una delle sue conseguenze deve essere spiegata se gli sviluppi successivi devono essere comprensibili.

Supponiamo di avere una serie di caratteristiche date come tutte le caratteristiche di un certo tipo, diciamo A, allora possiamo informarci su qualsiasi cosa, se ha una caratteristica del tipo A.

Se la possiede, questa sarà un’altra caratteristica di essa, e si pone la questione se questa caratteristica, la caratteristica di avere una caratteristica del tipo A , possa essere del tipo A, visto che presuppone la totalità di tali caratteristiche. La teoria dei tipi sostiene che non si può, e che possiamo solo sfuggire alla contraddizione dicendo che si tratta di una caratteristica di ordine superiore, e non può essere inclusa in qualsiasi asserzione riguardante tutte le caratteristiche di ordine inferiore. E più in generale, che ogni asserzione riguardante tutte le caratteristiche deve essere considerata totalmente nel senso d’un certo ordine . Questo sembrava di per sé plausibile, e anche l’unico modo per evitare certe contraddizioni che risultano dal confondere questi ordini di caratteristiche. Whitehead e Russell inoltre sostengono che le affermazioni sulle classi o aggregati sono da considerarsi veramente riguardanti le caratteristiche che definiscono le classi (una classe essendo sempre definita come la classe degli oggetti che possiedono una certa caratteristica), in modo che ogni affermazione su tutte le classi sarà effettivamente su tutte le caratteristiche, e sarà soggetta alle stesse difficoltà per quanto riguarda l’ordine di queste caratteristiche .

Tale teoria ci permette facilmente di evitare le contraddizioni della Teoria degli Aggregati , ma ha anche la sfortunata conseguenza di invalidare un tipo comune e importante di ragionamento matematico, il tipo di ragionamento con cui in ultima analisi stabiliamo l’esistenza del limite superiore di un aggregato, o l’esistenza del limite di una successione monotona limitata. Si è soliti dedurre queste proposizioni dal principio della sezione di Dedekind, che se i numeri reali sono divisi nel loro complesso in una classe superiore e una classe inferiore, ci deve essere un numero che le separa che appartiene o meno della classe superiore o il più grande della classe inferiore. Questo a sua volta è dimostrato dal considerare i numeri reali come sezioni dei razionali; le sezioni dei razionali sono un tipo particolare di classi dei razionali, e quindi una affermazione sui numeri reali sarà un’affermazione su un tipo di classi di razionali, cioè di una sorta di caratteristiche dei razionali, e le caratteristiche in questione dovranno essere limitate ad essere di un certo ordine.

Ora supponiamo di avere una aggregato E di numeri reali; questo sarà una classe di caratteristiche di razionali. ξ , il limite superiore di E, è definito come una sezione dei razionali che è la somma dei membri di E; cioè ξ è una sezione i cui membri sono tutti quei razionali che sono membri di qualsiasi membro di E, cioè, tutti quei razionali che hanno la caratteristica di avere una delle caratteristiche che che li rende membri della E. Così il limite superiore ξ è una sezione la cui caratteristica che lo definisce è quella di ordine superiore a quella dei membri di E. Quindi se tutti i numeri reali rappresentano tutte le sezioni dei razionali definiti da caratteristiche di un certo ordine, il limite superiore sarà, in generale, una sezione dei razionali definiti da una caratteristica di ordine superiore, e non sarà un numero reale.

Ciò significa che l’analisi , come ordinariamente intesa è interamente fondata su una sorta di fallace argomentazione, che se applicata in altri campi porta a risultati auto contraddittori.

Whitehead e Russell  hanno tentato di evitare questa sfortunata conseguenza della teoria dei tipi introducendo l’Assioma di Riducibilità, che asserisce che, per qualsiasi caratteristica di ordine superiore vi era una caratteristica equivalente di ordine inferiore – equivalente, nel senso che tutto ciò che ha l’una l’ha l’altra, in modo che esse definiscono la stessa classe. Il limite superiore, che abbiamo visto era una classe di razionali definita da una caratteristica di ordine superiore, verrebbe quindi ad essere definita anche dalla caratteristica equivalente di ordine inferiore, e sarebbe un numero reale. Purtroppo l’assioma non è certamente in sé evidente, e non vi è alcun motivo per supporlo vero. Se fosse vero questo sarebbe solo, per così dire, un felice accidente, e non sarebbe una verità logica come le altre proposizioni primitive .

Nella seconda edizione dei Principia Mathematica, il cui primo volume è stato pubblicato lo scorso anno, Russell ha mostrato come l’induzione matematica, per il quale l’Assioma di Riducibilità sembrava anche essere richiesto, può essere stabilita senza di esso, ma non offre alcuna speranza di successo simile con la Teoria dei Numeri Reali, per i quali il metodo ingegnoso utilizzato per l’insieme dei numeri non è disponibile. La questione è quindi lasciata in condizioni profondamente insoddisfacenti.

Ciò è stato sottolineato da Weyl, che ha pubblicato nel 1918 un libretto intitolato Das Kontinuum, in cui ha respinto l’Assioma di Riducibilità e ha accettato la conseguenza che l’analisi ordinaria era sbagliata. Ha mostrato , tuttavia, che i vari teoremi, come il Principio Generale di Convergenza di Cauchy, poteva ancora essere dimostrato.

Da allora Weyl ha cambiato il suo punto di vista e divenne un seguace di Brouwer, il leader di quella che viene chiamata la scuola intuizionista,la cui dottrina principale è la negazione della Legge del Terzo Escluso, che ogni proposizione è vera o falsa. 1 Questo è negato apparentemente perché è ritenuto impossibile conoscere un certo oggetto a priori, e altrettanto impossibile conoscerlo per esperienza, perché se non sappiamo né se sia vero o che sia falso, non possiamo verificare se sia vero o falso. Brouwer rifiuterebbe di essere d’accordo che o piove o non piove, a meno che non avesse guardato per vederlo.

1 Per esempio, come ha detto il Cavaliere Bianco: ‘ Tutti quelli che mi sentono cantare – o o gli vengono le lacrime agli occhi, oppure – ‘ . ‘ Altrimenti cosa ? ‘ Disse Alice, perché il Cavaliere aveva fatto una improvvisa pausa . ‘ Oppure no, sapete. ‘

Anche se è certamente difficile dare una spiegazione filosofica della nostra conoscenza delle leggi della logica, non posso persuadermi che non so per certo che la Legge del Terzo Escluso è vera; naturalmente, non può essere provata, anche se Aristotele ha dato il seguente ingegnoso argomento a suo favore. Se una proposizione è né vera né falsa, la chiameremo dubbia; ma allora se la Legge del Terzo Escluso fosse falsa, non sarebbe necessario che fosse dubbia o non dubbia, così avremo non solo tre possibilità, ma quattro, che è vera, che è falsa, che sia dubbia, e che non sia né vera, né falsa , né dubbia. E così via ad infinitum.

Ma se si rispondesse ‘ Perché no ? ‘, non ci sarebbe chiaramente più nulla da dire, e io non vedo come una base comune possa essere trovata da ciò per discutere la questione. I casi in cui Brouwer pensa la Legge del Terzo Escluso sia falsa sono quelli in cui, come dovrei dire, non potremmo dire se la proposizione sia vera o falsa; per esempio, 2√2 è razionale o irrazionale ? Non lo possiamo dire, ma Brouwer direbbe che non sia nessuno dei due. Non possiamo trovare due interi m , n modo che m/n = 2√2; quindi non è razionale: e non possiamo dimostrare che è impossibile trovare tali numeri interi; quindi, non è irrazionale.

Non riesco a vedere che la questione non è risolta dicendo che è o razionale o irrazionale , ma non possiamo dire quale sia. La negazione . La Legge del Terzo Escluso rende illegittimo il ragionamento chiamato dilemma, in cui viene mostrato che qualcosa segue da una ipotesi e anche dalla contraddizione di questa ipotesi, e si conclude che è vero incondizionatamente. Così Brouwer non è in grado di giustificare la gran parte della matematica comune, e le sue conclusioni sono ancora più scettiche rispetto a quelle della prima teoria di Weyl.

La seconda la teoria di Weyl è molto simile a quella di Brouwer, ma lui sembra negare la Legge del Terzo Escluso per motivi differenti, e in modo meno generale. Egli non sembra negare che ogni proposizione è vera o falsa, ma nega la legge derivata che o ogni numero ha una proprietà, o almeno un numero non l’ha. Spiega la sua negazione prima di tutto per i numeri reali nel modo seguente. Un numero reale è dato da una sequenza di numeri interi, per esempio, come decimale infinito; questa sequenza si può concepire come generata da una regola o da azioni successive di scelta. Se ora diciamo che c’è un numero reale o una sequenza avente una certa proprietà, questo può solo significare che abbiamo trovato una legge che ne fornisce una; ma se diciamo tutte le sequenze hanno una proprietà, noi intendiamo che l’avere la proprietà è parte dell’essenza di una sequenza, e quindi appartiene a sequenze che derivano non solo da regole ma da atti di libera scelta. Quindi non è vero che o tutte le sequenze hanno la proprietà o c’è una sequenza che non l’ha. Perché il significato di sequenza è differente nei due casi.

Ma non vedo perché non dovrebbe essere possibile usare la parola in modo coerente. Comunque sia, nulla di simile può essere addotto sull’insieme dei numeri che non sono definiti da sequenze, e così un altro motivo più fondamentale viene proposto per negare la Legge del Terzo Escluso. Il fatto è che le proposizioni generali esistenziali non sono affatto realmente proposizioni. Se dico ‘ 2 è un numero primo ‘ , questo è un giudizio vero e autentico che asserisce un fatto; ma se io dico ‘ C’è un numero primo ‘ o ‘ Tutti i numeri sono primi ‘ , io non esprimo affatto un giudizio. Se Weyl dice, la conoscenza è un tesoro, la proposizione esistenziale è un documento che attesta l’esistenza di un tesoro, ma senza dire dove esso si trova.

Possiamo solo dire ‘ Vi è un numero primo ‘ quando abbiamo precedentemente detto ‘Questo è un numero primo ‘ e dimenticato o scelto di ignorare quale particolare numero fosse. Quindi non è mai lecito dire ‘ C’è una così e così ‘ se non siamo in possesso di una costruzione per trovarne realmente una. Di conseguenza, la matematica deve essere considerevolmente modificata; per esempio, è impossibile avere una funzione di una variabile reale con più di un numero finito di discontinuità. Sul fondamento su cui poggia questo, vale a dire il punto di vista che le proposizioni esistenziali e generali non sono giudizi veri, tornerò più avanti.

Ma prima devo dire qualcosa del sistema di Hilbert e dei suoi seguaci, che mira a porre fine a tale scetticismo una volta per tutte. Questo viene fatto per quanto riguarda matematica superiore come manipolazione di simboli privi di significato secondo regole fisse. Iniziamo con alcune righe di simboli chiamati assiomi: da questi possiamo ricavarne altri sostituendo alcuni simboli chiamati costanti con gli altri chiamati variabili, e procedendo dalla coppia di formule p, se p allora q, alla formula q.

La matematica in senso proprio è pertanto considerata come una sorta di gioco, giocato con segni senza significato sulla carta un po’ come il filetto; ma oltre a questo ci sarà un altro soggetto chiamato metamatematica, che non è privo di significato, ma si compone di affermazioni vere circa la matematica, che ci dice che questa o quella formula può o non può essere ottenuta dagli assiomi secondo le regole di deduzione. Il teorema più importante di metamatematica è che non è possibile dedurre una contraddizione dagli assiomi, dove per contraddizione si intende una formula con un certo tipo di forma, che può essere assunta essere 0 ≠ 0 . Comprendo che Hilbert ha dimostrato questo, e ha così eliminato la possibilità di contraddizioni e lo scetticismo basato su di esse.

Ora, qualunque altra cosa un matematico stia facendo, sta certamente facendo segni sulla carta , e così questo punto di vista è costituito da nient’altro che verità; ma è difficile supporre tutta la verità. Ci deve essere una ragione per la scelta di assiomi, e qualche ragione per cui il segno particolare 0 ≠ 0 è considerato con tale orrore. Questo ultimo punto può tuttavia essere spiegato dal fatto che gli assiomi permetterebbero di dedurre qualsiasi cosa da 0 ≠ 0, in modo che se 0 ≠ 0 potesse essere provato, qualsiasi cosa potrebbe essere dimostrata, il che porrebbe fine al gioco per sempre, il che sarebbe molto noioso per i posteri. Inoltre, ci si può chiedere se sia davvero possibile dimostrare che gli assiomi non portino a contraddizione, dal momento che nulla può essere dimostrato a meno che si adottino alcuni principi per certi e assunti in modo che non portino a contraddizione. Questa obiezione è ammessa, ma si è sostenuto che i principi utilizzati nella prova metamatematica che gli assiomi della matematica non portano a contraddizioni, sono così ovviamente veri che nemmeno gli scettici possano dubitarne. Perché tutti questi non si riferiscono a cose astratte o infinitamente complesse, ma a segni sulla carta, e anche se qualcuno può dubitare che una sottoclasse di un certo tipo di serie infinite debba avere un primo termine, nessuno può dubitare che se = si verifica in una pagina, vi è un punto della pagina dove questo si verifica per la prima volta.

Ma, concedendo tutto questo, deve comunque essere domandato quale uso o valore vi sia in questo gioco che il matematico gioca, se sia davvero un gioco e non una forma di conoscenza; e l’unica risposta che viene data è che alcune formule del matematico hanno o possono essere assegnati significati, e che se queste possono essere provate nel sistema simbolico il loro significato sarà vero.

Perché Hilbert condivide il parere di Weyl che le proposizioni generali ed esistenziali sono prive di significato, in modo che le uniche parti della matematica che significano qualcosa sono le asserzioni particolari sugli interi finiti, come ‘ 47 è un numero primo ‘ e congiunzioni e disgiunzioni di un numero finito di tali affermazioni come ‘ C’è un numero primo tra 50 e 100 ‘ , che può essere considerata nel senso ‘ o ​​51 è un numero primo o 52 è un numero primo, ecc. , fino a, o 99 è un numero primo ‘. Ma, come tutte queste proposizioni della semplice aritmetica possono essere facilmente dimostrate senza utilizzare affatto la matematica superiore, questo uso per questo non può essere di grande importanza . E sembra che, anche se il lavoro di Hilbert fornisce un nuovo e potente metodo, che egli ha applicato con successo al problema del Continuo, come filosofia della matematica difficilmente può essere considerata adeguata .

Vediamo allora che queste autorità, per quanto grandi siano le differenze tra di loro, sono d’accordo che l’analisi matematica , come ordinariamente insegnata non possa essere considerata come un insieme di verità, ma è o falsa o al massimo un gioco senza significato con dei segni sulla carta; e questo significa, penso , che i matematici in questo paese dovrebbe porre una certa attenzione alle loro opinioni, e cercare di trovare il modo di affrontare la situazione .

Consideriamo quindi che tipo di difesa può essere fatta per la matematica classica , e la filosofia di Russell su di essa.

Dobbiamo iniziare con quella che sembra essere la questione cruciale, il significato di proposizioni generali ed esistenziali, su cui Hilbert e Weyl hanno sostanzialmente la stessa opinione. Weyl dice che una proposizione esistenziale non è un giudizio, ma un’astrazione di un giudizio, e che una proposizione generale è una sorta di assegno che può essere incassato per un vero e proprio giudizio quando si verifica un caso particolare di questa proposizione.

Hilbert, meno metaforicamente, dice che sono proposizioni ideali, e svolgono la stessa funzione in logica come gli elementi ideali in varie branche della matematica. Egli spiega la loro origine in questo modo; una vera e propria proposizione definita come ‘Esiste un numero primo tra 50 e 100’ , noi la scriviamo ‘ Vi è un numero primo che è superiore a 50 e inferiore a 100 ‘ , che sembra contenerne un parte , ‘ 51 è un numero primo , o 52 è un numero primo , ecc. , ad inf., ‘ e così sarebbe una somma logica infinita, che, come una somma algebrica infinita, è prima di tutto senza senso, e le può essere solo dato un significato secondario a determinate condizioni di convergenza. Ma l’introduzione di queste forme senza significato semplifica così le regole di inferenza che è conveniente serbarle, considerandole come ideali, per ciò in cui un teorema coerenza debba essere provato.

In questa punto di vista della questione mi sembrano esserci diverse difficoltà. In primo luogo è difficile vedere quale uso per questi ideali si possa supporre vi sia; perché la matematica propriamente detta sembra essere ridotta all’aritmetica elementare, non essendo neppure ammessa l’algebra, perché l’essenza dell’algebra è quello di fare affermazioni generali. Ora, qualsiasi formula di aritmetica elementare può essere facilmente provata e dimostrata senza l’utilizzo della matematica superiore, che, se se ne suppone l’esistenza solo per la sola aritmetica, sembra del tutto inutile. In secondo luogo, è difficile vedere come la nozione di un ideale può respingere la possibilità di una conoscenza generale. Perché la giustificazione degli ideali sta nel fatto che tutte le proposizioni che non contengono ideali possono essere dimostrate per mezzo di essi che sono vere. E così la metamatematica di Hilbert , che è accettato essere genuina verità, è destinata a consistere di proposizioni generali su tutte le possibili dimostrazioni matematiche, che , anche se ogni dimostrazione è una costruzione finita, potrebbero essere in numero infinito. E se, come dice Weyl, una proposizione esistenziale è un documento che attesta l’esistenza di un tesoro di conoscenza, ma non dice dove si trova, non vedo come si spiega l’utilità di un tale documento, se non presupponendo il suo destinatario capace della conoscenza esistenziale che c’è un tesoro da qualche parte.

Inoltre, anche se il ragionamento di Hilbert potesse essere accettato finché limitiamo la nostra attenzione alla matematica, non vedo come potrebbe essere reso plausibile per quanto riguarda la conoscenza in generale. Quindi, se ti dico ‘ possiedo un cane’, sembra che tu ottenga la conoscenza di un fatto; banale, ma sempre conoscenza.

Ma ‘ io possiedo un cane ‘ deve essere messo in simbolismo logico come ‘ Esiste qualcosa che è un cane e posseduta da me ‘ , così che la conoscenza è la conoscenza di una proposizione esistenziale, che copre la possibile infinita gamma degli ‘oggetti’. Ora si potrebbe forse sostenere che la mia conoscenza che possiedo un cane derivi nel certo modo che Hilbert descrive dal mio scindere non correttamente quello che sembra essere parte di una proposizione finita, come ‘ Rolf è un cane e posseduto da me ‘, ma la vostra conoscenza non può assolutamente essere spiegata in questo modo, perché la proposizione esistenziale esprime tutto ciò che hai sempre conosciuto, e probabilmente tutto quello che sempre conoscerai sulla questione.

Infine, anche i fatti apparentemente particolari dell’aritmetica semplice aritmetica mi sembrano essere in verità generali. Perché cosa sono questi numeri, che cosa riguardano ? Secondo Hilbert segni sulla carta costruita con i segni 1 e + .

Ma questo ragionamento mi sembra inadeguato, perché se avessi detto ‘ ho due cani ‘, anche questo ti direbbe qualcosa; tu capiresti la parola ‘ due ‘, e l’intera frase potrebbe essere resa qualcosa come ‘ ci sono x e y , che sono i miei cani e non sono identici uno con l’altro ‘. Questa affermazione sembra coinvolgere l’ idea di esistenza, e di non riguardare segni sulla carta; così che io non vedo che possa essere seriamente sostenuto che un numero cardinale che risponde alla domanda ‘ Quanti ? ‘ sia solo un segno sulla carta. Se allora prendiamo uno di questi singoli fatti aritmetici, come 2 + 2 = 4, questo mi sembra che significhi ‘ Se i p sono in numero di due , e i q anche, e nulla è sia contestualmente un p ed un q, allora il numero di cose che sono o p o q sono quattro.’

Perché questo è il senso in cui dobbiamo prendere 2 + 2 = 4 , al fine di utilizzare, come noi facciamo, per dedurre dal fatto che ho due cani e due gatti ‘ che ho quattro animali domestici. Questo fatto apparentemente particolare, 2 + 2 = 4, quindi contiene diversi elementi di generalità ed esistenza, in primo luogo perché i p e q sono caratteristiche assolutamente generali, e in secondo luogo perché le parti della proposizione, come ‘ se i p sono in numero di due ‘, coinvolgiamo, come abbiamo visto, l’ idea di esistenza.

È possibile che l’intera asserzione che proposizioni generali ed esistenziali non possono esprimere giudizi veri o che la conoscenza è puramente verbale; che ciò sia semplicemente deciso per sottolineare la differenza tra proposizioni particolari e generali rifiutando di utilizzare le parole giudizio e conoscenza in connessione con la quest’ultima. Questo, tuttavia, sarebbe un peccato, perché tutte le nostri associazioni naturali con le parole giudizio e conoscenza si adattano alle proposizioni generali ed esistenziali così come fanno con quelle particolari; perché in entrambi i casi possiamo sentire maggiore o minore grado di convinzione sulla questione, e in entrambi i casi possiamo essere in un qualche senso nel giusto o in errore. E il suggerimento che implica, che la conoscenza generale e esistenziale esiste semplicemente per il gusto della conoscenza individuale, mi sembra del tutto falso. Nel teorizzare ciò quello che noi principalmente ammiriamo è la generalità, e nella vita ordinaria può essere abbastanza sufficiente conoscere la  proposizione esistenziale che ci sia un toro da qualche parte in un certo campo, e non ci può essere alcun ulteriore vantaggio nel sapere che è questo toro qui nel campo, anziché semplicemente un toro da qualche parte .

Come allora spieghiamo le proposizioni generali ed esistenziali ? Non credo che possiamo fare di meglio che accettare il punto di vista che è stato proposto da Wittgenstein come conseguenza della sua teoria delle proposizioni in generale. Egli le spiega facendo riferimento a ciò che può essere chiamato proposizioni atomiche, che asseriscono il più semplice tipo possibile di fatto, e può essere espresso senza usare nemmeno implicitamente eventuali termini logici come o , se , tutti, alcuni . ‘Questo è rosso ‘ è forse un esempio di una proposizione atomica. Supponiamo ora che abbiamo, diciamo, n proposizioni atomiche; per quanto riguarda la loro verità o falsità , ci sono al massimo 2n possibilità mutualmente esclusive.

Chiamiamo queste le possibilità di verità delle n proposizioni atomiche; allora possiamo prendere qualsiasi sotto – insieme di queste possibilità di verità e affermare che esiste una possibilità di questo sotto – insieme, che è, in realtà, soddisfatta. Possiamo scegliere questo sotto-insieme di possibilità in cui affermare la verità risulta in

Schermata 2014-02-04 alle 11.46.42

 

modi: e queste saranno tutte le proposizioni che possiamo costruire su queste n proposizioni atomiche. Così, per fare un semplice esempio, ‘ Se p , allora q ‘ esprime accordo con le tre possibilità, che sia p sia q siano vere, che p è falso e q vero, e che p è falso e q falso, e nega la rimanente possibilità che p è vero e q falso.

Si può facilmente vedere che da questo punto di vista c’è una ridondanza in tutti notazioni logiche ordinarie, perché possiamo scrivere in molti modi diversi ciò che è essenzialmente la stessa proposizione, esprimendo accordo e disaccordo con gli stessi insiemi di possibilità.

Wittgenstein sostiene che tutte le proposizioni esprimono accordo e disaccordo con possibili verità delle proposizioni atomiche, o , come diciamo, sono funzioni verità di proposizioni atomiche; anche se spesso le proposizioni atomiche in questione non vengono enumerate, ma definite come tutti i valori di un certa funzione proposizionale. Così la funzione proposizionale ‘ x è rosso ‘ determina un insieme di proposizioni che sono i suoi valori, e noi possiamo asserire che tutti o almeno uno di questi valori sono veri nel dire ‘ Per tutte le x , x è rosso ‘ e ‘ C’è una x tale che x è rossa ‘ , rispettivamente. Vale a dire, se si potessero enumerare i valori di x come a, b ​​. . . z , ‘ Per tutte le x , x è rosso ‘ sarebbe equivalente alla proposizione ‘ a è rosso e b è rosso . . . e z è rosso’. E’ chiaro , naturalmente, che lo stato d’animo di un uomo che usa una espressione differisce per molti aspetti da quella di un uomo che usa l’altra, ma quello che potrebbe essere chiamato il significato logico della dichiarazione, il fatto che si afferma essere, è lo stesso nei due casi.

E’ impossibile discutere adesso tutti gli argomenti che potrebbero essere usati contro questo punto di vista, ma qualcosa deve essere detto a proposito della tesi di Hilbert, che se la variabile ha un numero infinito di valori, se, cioè, ci sono un infinito numero di oggetti nel mondo di tipo logico in questione, abbiamo qui una somma logica infinita o un prodotto infinito che, come una somma algebrica infinita o un prodotto, è dall’inizio priva di senso e le può essere dato un significato solo in modo indiretto. Questo mi sembra poggiare su una falsa analogia; la somma logica di un insieme di proposizioni è la proposizione di cui almeno un termine dell’insieme è vero, e non sembra avere importanza se l’insieme è finito o infinito.

Non è come una somma algebrica la cui finitezza è essenziale, dal momento che questa viene estesa passo dopo passo dalla somma di due termini .

Dire che tutto ciò che coinvolge potenzialmente un’infinito di qualsiasi tipo deve essere priva di significato è dichiarare in anticipo che una vera teoria degli aggregati è impossibile.

Oltre ad una semplice considerazione di proposizioni esistenziali e generali, la teoria di Wittgenstein risolve un’altra questione di primaria importanza spiegando con precisione la natura peculiare delle proposizioni logiche. Quando Russell prima dice che la matematica potrebbe essere ridotta alla logica, il suo punto di vista della logica era che consisteva di tutte le assolutamente generali proposizioni vere, proposizioni  cioè, che non contenevano nessuna costante materiale (in contrapposizione a quelle logiche). In seguito ha abbandonato questo punto di vista, perché era chiaro che era richiesta qualche ulteriore caratteristica oltre alla generalità. Perché sarebbe possibile descrivere tutto il mondo, senza menzionare alcuna cosa particolare, e chiaramente qualcosa potrebbe per caso essere vera di qualsiasi cosa che non avesse il carattere di necessità che appartiene alle verità della logica.

Se, poi, vogliamo capire quale logica, e così secondo il punto di vista di Russell quale matematica sia, dobbiamo cercare di definire questo ulteriore caratteristica che può essere vagamente chiamata necessità, o da un altro punto di vista tautologia. Ad esempio, ‘ p è o vero o falso ‘ può essere considerata sia una verità necessaria, o come una semplice tautologia . Questo problema viene risolto incidentalmente dalla teoria delle proposizioni di Wittgenstein. Le proposizioni, abbiamo detto, esprimono accordo e disaccordo con le possibilità di verità di proposizioni atomiche. Date n proposizioni atomiche, ci sono 2n possibilità di verità , e possiamo essere d’accordo con qualsiasi insieme di questi e in disaccordo con le restanti.

Ci saranno poi due casi estremi, quello in cui siamo d’accordo con tutte le possibilità, e in disaccordo con nessuno , l’altra in cui siamo d’accordo con nessuna e in disaccordo con tutte. La prima si chiama una tautologia, l’ultima una contraddizione.

La tautologia semplice è ‘ p o non p’: una tale affermazione non aggiunge nulla alla nostra conoscenza , e in realtà non asserisce affatto un fatto; ma è, per così dire , non una vera proposizione, ma un caso degenere . E si può trovare che tutte le proposizioni della logica sono in questo senso tautologie; e questa è la loro caratteristica distintiva. Tutte le proposizioni primitive nei Principia Mathematica sono tautologie, tranne l’Assioma di Riducibilità, e le regole di deduzione sono tali che da tautologie possono essere dedotte solo tautologie, in modo che se non fosse per quella magagna, l’intera struttura si comporrebbe di tautologie. Siamo dunque portati indietro alla vecchia difficoltà, ma è possibile sperare che anche questo può essere rimosso da alcune modifiche della Teoria dei Tipi che possono derivare dall’analisi di Wittgenstein.

Una teoria dei tipi ci deve consentire di evitare le contraddizioni; la teoria di Whitehead e Russell consisteva in due parti distinte, accomunate solo dal fatto di essere sia dedotte dal piuttosto vago ‘Principio del Circolo Vizioso’. La prima parte distingueva le funzioni proposizionali in base ai loro argomenti, cioè le classi in base ai loro membri; la seconda parte ha creato la necessità dell’Assioma di Riducibilità con il richiedere ulteriori distinzioni tra ordini di funzioni con lo stesso tipo di argomento.

Possiamo facilmente dividere le contraddizioni secondo quale parte della teoria è richiesta per la loro soluzione, e quando abbiamo fatto questo troviamo che questi due insiemi di contraddizioni si distinguono anche in un altro modo. Quelli risolte dalla prima parte della teoria sono tutte puramente logiche; quelle che non coinvolgono idee ma quelle di classe, relazione e numero, potrebbero essere poste secondo la logica simbolica, e si verificano nello sviluppo effettivo della matematica quando viene diretta nella giusta direzione.

Tali sono la contraddizione del più grande ordinale, e quello della classe di classi che non sono membri di se stessi .

Per quanto riguarda la soluzione di questi Russell sembra insostituibile.

D’altra parte, nessuna di quelle del secondo insieme di contraddizioni sono puramente logiche o matematiche, ma tutte coinvolgono qualche termine psicologico, come significare, definire, nominare o affermare. Essi non si verificano nella matematica, ma nel pensiero sulla matematica; così che è possibile che non derivano da un errore di logica o di matematica, ma dall’ambiguità nelle nozioni psicologiche o epistemologiche del significare e dell’asserire. Infatti, sembra che questo dovrebbe essere il caso, in quanto l’esame ci convince rapidamente che il termine psicologico è in ogni caso essenziale per la contraddizione, che non potrebbe essere costruita senza introdurre la relazione delle parole con il loro significato o qualche equivalente.

Se ora proviamo ad applicare al problema la teoria di generalità di Wittgenstein, possiamo, credo , abbastanza facilmente costruire una soluzione in tal senso. Spiegare questo adeguatamente richiederebbe un articolo a parte, ma può essere possibile darne un’idea in poche parole. Per la teoria di Wittgenstein una proposizione generale è equivalente ad una combinazione dei suoi casi, così che il tipo di fatto asserito da una proposizione generale non è sostanzialmente da quanto affermato da una combinazione di proposizioni atomiche. Ma il simbolo per una proposizione generale indica il suo significato in un modo diverso da quello in cui il simbolo di una proposizione elementare lo indica, perché quest’ultimo contiene i nomi di tutte le cose che lo riguardano, mentre il simbolo della proposizione generale contiene solo una variabile che sta per tutti i suoi valori ad un tempo. In modo che sebbene i due tipi di simbolo possano significare la stessa cosa, i sensi del significato in cui essi lo indicano devono essere diversi. Quindi gli ordini di proposizioni non saranno caratteristici di ciò che si intende, che è solo rilevante in matematica, ma dei simboli utilizzati per significarlo.

Le proposizioni del primo ordine saranno un po’ come le parole parlate; la stessa parola può essere scritta e parlata, e la stessa proposizione può teoricamente essere espressa in diversi ordini.

Applicando questo mutatis mutandis alle funzioni proposizionali, troviamo che le distinzioni tipiche tra funzioni con gli stessi argomenti non si applicano a ciò che significano, ma alla relazione di significato tra simbolo e oggetto significato. Di conseguenza, esse possono essere trascurate in matematica, e la soluzione delle contraddizioni può essere salvaguardata in una forma leggermente modificata, perché le contraddizioni pertinenti qui tutte hanno a che fare con la relazione di significato.

In questo modo penso che sia possibile sfuggire alla difficoltà dell’Assioma di Riducibilità, e rimuovere le varie altre obiezioni più filosofiche, che sono state fatte da Wittgenstein, riabilitando così il ragionamento generale dei Foundations of Mathematics date da Whitehead e Russell. Ma rimane comunque un punto importante in cui la teoria risultante deve essere considerata insoddisfacente, e che è in connessione con l’Assioma dell’Infinito .

Secondo gli autori dei Principia Mathematica non c’è modo di dimostrare che ci sono un numero infinito di oggetti in qualsiasi tipo logico; e se non c’è un numero infinito di qualsiasi tipo, l’intera teoria degli aggregati infiniti, serie, calcolo differenziale e analisi in generale cade.

Secondo la loro teoria di numero, se ci fossero solo dieci particolari, nel senso di numero appropriato a quei particolari tutti i numeri maggiori di dieci sarebbero identici alla classe nulla e così identici tra loro. Naturalmente ci sarebbero 210 classi di particolari, e quindi il successivo tipo di numero sarebbe certamente fino al 210, e così prendendo un tipo abbastanza elevato può essere raggiunto qualsiasi numero finito.

Ma sarà impossibile in questo modo raggiungere ℵ0.

Ci sono vari suggerimenti naturali per uscire da questa difficoltà, ma tutti questi sembrano portare a ricostituire la contraddizione del più grande ordinale.

Sembrerebbe quindi impossibile proporre l’analisi se non come conseguenza dell’Assioma dell’Infinito; né posso vedere che questo possa essere in generale discutibile, perché ci sarebbe poco senso dimostrare proposizioni su serie infinita a meno che questi oggetti esistessero. E d’altra parte la matematica di un mondo con un dato numero finito di membri è di scarso interesse teorico, in quanto tutti i suoi problemi possono essere risolti con un procedimento meccanico .

Ma una difficoltà mi sembra sorgere in relazione alle proposizioni elementari nella teoria dei numeri che possono essere dimostrati soltanto con metodi trascendentali, come la valutazione di Dirichlet della classe di numeri di forme quadratiche. Consideriamo un tale risultato della forma ‘ Ogni numero ha la proprietà p’ , dimostrata con metodi trascendentali solo per il caso di un mondo infinito; oltre a questo, se sapessimo che il mondo conteneva ad esempio, 1.000.000 di oggetti, potremmo dimostrarlo esaminando i numeri fino a 1.000.000. Ma supponiamo che il mondo è finito e ancora non conosciamo un qualsiasi limite superiore alla sua dimensione, allora siamo senza alcun metodo affatto di dimostrarlo.

Si potrebbe pensare che avremmo potuto sfuggire a questa conclusione dicendo che, sebbene non possa esistere nessun aggregato infinito, la nozione di un aggregato infinito non è auto- contraddittoria, e quindi ammissibile in matematica. Ma penso che questo suggerimento è inutile, per tre motivi: in primo luogo, appare come risultato di qualche piuttosto difficile, ma penso conclusivo, ragionamento di Wittgenstein che , se accettiamo la sua teoria delle proposizioni generali ed esistenziali (ed era solo il modo con cui potremmo sbarazzarci dell’Assioma di Riducibilità), ne consegue che, se non esistesse nessun insieme infinito il concetto di tale aggregato sarebbe auto-contraddittorio; in secondo luogo, tuttavia, potrebbe essere, è generalmente accettato che l’unico modo di dimostrare che certi postulati sono compatibili, che sia attraverso un teorema di esistenza che dimostra che in realtà esiste e non semplicemente che potrebbe esistere un sistema del genere postulato; in terzo luogo, anche se fosse scontato che l’idea di un aggregato infinito non sia auto-contraddittoria, dovremmo fare grandi modifiche nel nostro sistema di logica, al fine di convalidare le prove dipendenti dalle costruzioni in termini di oggetti che potrebbero esistere, ma non esistono. Il sistema dei Principia sarebbe del tutto inadeguato. Cosa allora si può fare ? Possiamo cercare di alterare le prove di tali proposizioni, e potrebbe quindi essere interessante cercare di sviluppare una nuova matematica senza l’ Assioma dell’Infinito; i metodi da adottare potrebbero assomigliare a quelli di Brouwer e Weyl. Tali autorità, tuttavia, mi sembrano essere scettiche circa le cose sbagliate nel respingere non l’Assioma dell’Infinito, ma la chiaramente tautologica Legge del Terzo Escluso. Ma non mi sento affatto sicuro che ogni cosa possa essere realizzata su queste linee di pensiero che sostituirebbero gli argomenti trascendentali attualmente impiegati.

Un’altra possibilità è che dovrebbe essere adottato il metodo generale di Hilbert, e che dovremmo usare la sua prova che nessuna contraddizione può essere dedotta dagli assiomi della matematica includendo un equivalente dell’Assioma dell’Infinito. Possiamo quindi argomentare così: se un dato numero ha o non ha la proprietà p può sempre essere trovato mediante il calcolo. Questo ci darà una prova formale del risultato per questo numero particolare, che non può contraddire il risultato generale dimostrato dall’Assioma dell’Infinito che deve quindi essere valido.

Ma questo argomento sarà ancora incompleto, perché si applicherà solo ai numeri che possono essere indicati con simboli nel nostro sistema.

E se stiamo negando l’ Assioma dell’Infinito, ci sarà un limite superiore al numero di segni che possono essere fatti sulla carta, dal momento che lo spazio e il tempo saranno finiti, sia in estensione sia in divisibilità, in modo che alcuni numeri saranno troppo grandi per essere scritti, e ad essi la prova non si applicherà. E questi numeri essendo finiti saranno esistenti in un tipo sufficientemente alto, e la teoria di Hilbert non ci aiuterà a dimostrare che essi hanno la proprietà p.

Un altra grave difficoltà circa l’ Assioma dell’Infinito è che, se è falso, è difficile vedere come l’analisi matematica possa essere utilizzata in fisica, che sembra richiedere alla sua matematica di essere vera e non solo di seguire da ipotesi potenzialmente false. Ma discutere questo in maniera adeguata ci porterebbe troppo lontano.

Su come portare avanti la questione ulteriormente, non ho alcun suggerimento da fare; tutto quello che spero è di aver messo in chiaro che l’argomento è molto difficile, e che le principali autorità sono molto scettiche sul fatto che la matematica pura come ordinariamente pensata possa essere logicamente giustificata, perché Brouwer e Weyl dicono che non può, e Hilbert propone soltanto di giustificarla come un gioco con segni senza senso sulla carta. D’altra parte, sebbene il mio tentativo di ricostruzione del punto di vista di Whitehead e Russell superi molte delle difficoltà, credo che sia impossibile considerarla del tutto soddisfacente.

Principia Mathematica cap. 5 – di The Foundation of Mathematics di Frank P. Ramsey

17 Mag

Frank_Plumpton_RamseyRiporto di seguito la mia traduzione del quinto capitolo della prima parte delle opere di F.P. Ramsey,  come pubblicate in The Foundation of Mathematics a cura di R.B. Braithwaite nella sezione I capitolo IV, con il titolo Gli Assiomi.

V. GLI ASSIOMI

Ho mostrato negli ultimi due capitoli come porre rimedio ai tre i principali difetti di Principia Mathematica come fondamento della matematica. Ora dobbiamo considerare due importanti problemi che rimangono che riguardano l’Assioma dell’Infinito e l’Assioma moltiplicativo. L’introduzione di questi due assiomi non è così grave come quello dell’Assioma di Riducibilità, perché non sono di per sé presupposti discutibili, e perché la matematica è in gran parte indipendente dall’Assioma moltiplicativo, e si può ragionevolmente supporre che possa richiedere un Assioma dell’Infinito. Tuttavia, dobbiamo cercare di determinare lo stato logico di tali assiomi – se sono tautologie o proposizioni empiriche o addirittura contraddizioni. In questa indagine comprenderò, per curiosità, l’Assioma di Riducibilità, anche se, dal momento che abbiamo rinunciato ad esso, in realtà non ci interessa più.

Cominciamo con l’Assioma di Riducibilità, che afferma che tutte le funzioni di particolari ottenute per generalizzazione di matrici sono equivalenti a funzioni elementari. Nel discuterlo si presentano molti casi, dei quali io considero solo il più interessante, quello cioè in cui il numero di particolari e di funzioni atomiche di particolari sono entrambi infiniti. In questo caso l’assioma è una proposizione empirica, vale a dire, né una tautologia né una contraddizione, e quindi non può essere né affermata né negata dalla logica o matematica. Questo è mostrato come segue: –

( a) L’assioma non è una contraddizione, ma può essere vero.

Perché è chiaramente possibile che ci potrebbe essere una funzione atomica che definisce ogni classe di particolari. In tal caso ogni funzione sarebbe equivalente non solo a una funzione elementare ma a una funzione atomica.

( b) L’assioma non è una tautologia, ma può essere falso.

Perché è chiaramente possibile che vi sia una infinità di funzioni atomiche, e un particolare a tale che qualsiasi funzione atomica prendiamo c’è un altro particolare che si accorda con a in relazione a tutte le altre funzioni, ma non per quanto riguarda la funzione di assunta.  Allora (φ) . φ ! x ≣φ ! a non potrebbe essere equivalente a qualsiasi funzione elementare di x.

Avendo così dimostrato che l’Assioma di Riducibilità non è né una tautologia né una contraddizione, cerchiamo di procedere con l’Assioma moltiplicativo. Questo afferma che, data una qualsiasi classe K esistente delle classi esistenti, c’è una classe che ha esattamente un elemento in comune con ogni membro di K. Se per ‘classe’ intendiamo, come faccio io , qualsiasi insieme di oggetti omogenei nel tipo non necessariamente definibile con una funzione che non sia una pura funzione in estensione, l’Assioma moltiplicativo mi sembra la più evidente tautologia. Non vedo come questo possa essere oggetto di ragionevole dubbio, e penso che non sarebbe mai stato messo in dubbio se non fosse stato male interpretato. Perché il significato che ha in Principia, dove la classe la cui esistenza esso asserisce deve essere una classe definibile con una funzione proposizionale del genere che si verifica in Principia, diventa veramente dubbio e, come l’Assioma di Riducibilità, né una tautologia né una contraddizione. Dimostriamo questo mostrando

( a) Non è una contraddizione.

Perché è chiaramente possibile che ogni classe (nel mio senso ) dovrebbe essere definita da una funzione atomica, in modo che, dal momento che è inevitabile che ci sia una classe nel mio senso avente un membro in comune con ciascun membro di K, questa sarebbe anche una classe nel senso dei Principia.

( b) Non è una tautologia.

Per dimostrare questo abbiamo bisogno di prendere non l’Assioma moltiplicativo in sé, ma il teorema equivalente che due classi qualsiasi sono commensurabili.

Si consideri poi il seguente caso: non ci siano funzioni atomiche di due o più variabili, e solo le seguenti funzioni atomiche di una variabile: –

Associato a ciascun particolare a ad una funzione atomica φSchermata 2013-08-22 alle 18.42.59 tale che

φa x. ≣x . x = a

Un’altra funzione atomica fSchermata 2013-08-22 alle 18.42.59 tale che Schermata 2013-08-22 alle 18.42.59 ( fx ) , Schermata 2013-08-22 alle 18.42.59 ( ~ fx) sono entrambe classi infinite.

Allora non c’è una relazione biunivoca, nel senso dei Principia, aventi una Schermata 2013-08-22 alle 18.42.59 ( fx ) o Schermata 2013-08-22 alle 18.42.59 ( ~ fx ) per dominio, e quindi queste due classi sono incommensurabili. Da qui l’Assioma moltiplicativo, interpretato come è nei Principia, non è una tautologia, ma è dubbio dal punto di vista della logica. Ma, come l’ho interpretato, è una tautologia evidente, e questo può essere affermato come un ulteriore vantaggio nella mia teoria. Si potrebbe obiettare che, se si tratta di una tautologia, dovrebbe essere in grado di essere provato, cioè dedotto da più semplici proposizioni primitive che sono sufficienti per la deduzione del resto della matematica. Ma non mi sembra affatto improbabile che potrebbe esistere una tautologia, che potrebbe essere posta in termini finiti, la cui dimostrazione sarebbe, tuttavia, infinitamente complicata e quindi impossibile per noi. Inoltre, non possiamo aspettarci di dimostrare l’Assioma moltiplicativo nel mio sistema, perché il mio sistema è formalmente la stesso di quello dei Principia , e l’Assioma moltiplicativo ovviamente non può essere dimostrato nel sistema dei Principia, in cui non è una tautologia.

Veniamo ora all’Assioma dell’Infinito, di cui ancora una volta il mio sistema e quello dei Principia danno diverse interpretazioni. Nei Principia, a causa della definizione dell’identità ivi utilizzato, l’assioma significa che esistono un’infinità di particolari distinguibili, che è una proposizione empirica; dal momento che, anche supponendo che ci sia un’infinità di particolari, la logica non può determinare se esistendo una infinità di questi non ci siano due di questi che abbiano le loro proprietà in comune; ma nel mio sistema, che ammette funzioni di estensione, l’Assioma dell’Infinito afferma semplicemente che ci sono un numero infinito di particolari. Questo sembra ugualmente essere una mera questione di fatto; ma la profonda analisi di Wittgenstein ha dimostrato che questa è un’illusione, e che, se questo significa qualcosa, deve essere o una tautologia o una contraddizione. Questo sarà molto più facile da spiegare se cominciamo non con l’infinito, ma con un numero un po’ più piccolo.

Cominciamo con ‘ Esiste un particolare ‘ , o scrivendo nel modo più semplice possibile, in notazione logica,

‘ ( ∃ x ) . x = x ‘

Ora che cosa è questa proposizione? E ‘ la somma logica delle tautologie x = x per tutti i valori di x , ed è quindi una tautologia. Ma supponiamo che non ci siano particolari, e quindi nessun valore di x, allora la formula di cui sopra è una assoluto nonsenso. Quindi, se questo significa qualcosa, deve essere una tautologia.

Inoltre prendiamo ‘ Ci sono almeno due individui ‘ o

‘ ( ∃ x , y ) . x ≠ y ‘ .

Questa è la somma logica delle proposizioni x ≠ y , che sono tautologie se x e y hanno valori diversi, contraddizioni se hanno lo stesso valore. Perciò, è la somma logica di un insieme di tautologie e contraddizioni; e quindi una tautologia se uno qualsiasi degli insiemi è una tautologia, ma altrimenti una contraddizione. Cioè, è una tautologia se x e y possono assumere valori diversi (ad esempio se ci sono due particolari), ma altrimenti una contraddizione.

Una piccola riflessione renderà chiaro che questo non riguarda il caso solo di 2, ma di qualsiasi altro numero, finito o infinito. Cioè, ‘ Ci sono almeno n particolari’ è sempre o una tautologia o una contraddizione, mai una vera e propria proposizione. Non possiamo, dunque, dire nulla circa il numero di particolari, dal momento che, quando tentiamo di farlo, non riusciremmo mai a costruire una vera proposizione, ma soltanto una formula che è o tautologica o auto – contraddittoria. Il numero di particolari può, nella frase di Wittgenstein, essere solo indicato, e sarà dimostrato dal fatto che le formule di cui sopra sono tautologiche o contraddittorie.

La sequenza ‘ Esiste un particolare ‘,

‘ Esistono almeno 2 particolari ‘,

‘ Esistono almeno n particolari ‘,

‘ Esistono almeno ℵ0 particolari ‘,

‘ Esistono almeno ℵ1 particolari ‘,

comincia con l’essere tautologica; ma da qualche parte comincia con l’essere contraddittoria, e la posizione dell’ultimo termine tautologico mostra il numero di particolari.

Ci si potrebbe chiedere come, se non si può dire nulla su questo, siamo in grado di immaginare come distinte possibilità che il numero di particolari nel mondo sia così e così. Facciamo questo solo quando assumiamo non un limitato universo in esame, a cui saremmo confinati, così che con ‘tutto’ intendiamo tutto nell’universo in esame; e allora questo universo così e così che contiene tali e tali particolari è una possibilità effettiva, e può essere asserito in una genuina proposizione. E’ questo solo quando assumiamo, non un limitato universo in esame, ma l’intero mondo, di cui nulla può essere detto sul numero di particolari  in esso contenuti.

Possiamo fare logica , non solo per il mondo nel suo insieme, ma anche per un determinato universo limitato nella trattazione; se ne assumiamo uno contenente n individui,

Nc’Schermata 2013-08-22 alle 18.42.59 ( x = x ) ≥ n sarà una tautologia,

Nc’Schermata 2013-08-22 alle 18.42.59 ( x = x ) ≥ n + 1 una contraddizione ,

Quindi Nc’Schermata 2013-08-22 alle 18.42.59 ( x = x ) ≥ n + 1 non può essere dedotta dalle proposizioni primitive comuni a tutti gli universi, e quindi per un universo che contiene n + 1 individui deve essere presa come una proposizione primitiva.

Analogamente, l’Assioma dell’Infinito nella logica del mondo nel suo insieme, se si tratta di una tautologia, non può essere provato, ma deve essere preso come una proposizione primitiva . E questa è la direzione che dobbiamo adottare, a meno che preferiamo il punto di vista che tutta l’analisi è auto – contraddittoria e priva di significato . Non dobbiamo supporre che un particolare insieme di oggetti, ad esempio, gli atomi, sia infinito, ma semplicemente che c’è un certo tipo di infinito che possiamo assumere essere il tipo dei particolari.

NdT: quest’ultima proposizione chiude il discorso sull’esistenza o non esistenza dell’infinito (matematico o fisico). Infatti si può chiaramente osservare che l’applicazione di un tipo particolare di infinito nasce dall’impossibilità di determinare se un infinito esista anche se non conduce a contraddizioni logiche. Infatti è evidente che esistono dei procedimenti che non possono essere conclusi neppure se tutta l’umanità fino alla sua estinzione cercasse di portarli a compimento. In questi casi è indifferente sapere se il procedimento è finito o infinito in quanto non ci sarebbe nessuno in grado di trovare il risultato e di riprodurlo nel proprio sistema secondario. Mentre nel sistema primario potrebbe esistere, ma sarebbe un nonsenso per mancanza di chi è in grado di valutarlo.

Principia Mathematica cap. 4 – di The Foundation of Mathematics di Frank P. Ramsey

16 Mag

NPG x31078; Richard Bevan Braithwaite by Ramsey & MusprattRiporto di seguito la mia traduzione del quarto capitolo della prima parte delle opere di F.P. Ramsey,  come pubblicate in The Foundation of Mathematics a cura di R.B. Braithwaite nella sezione I capitolo IV, con il titolo Funzioni proposizionali in estensione.

IV . Funzioni proposizionali in estensione

Prima di andare avanti, guardiamoci attorno e vediamo dove siamo arrivati. Abbiamo visto che l’introduzione della nozione di funzione predicativa ci ha dato un insieme per φ che ci permette di fare a meno dell’Assioma di Riducibilità. Quindi rimuove il secondo e più importante difetto nella teoria dei Principia Mathematica; ma in quale rapporto stiamo per quanto riguarda le altre difficoltà, la difficoltà di includere tutte le classi e le relazioni in estensione, e non solo quelle definibili, e le difficoltà connesse con l’identità?

Possiamo sbarazzarci della difficoltà sull’identità, a costo di notevoli complicazioni, adottando la  convenzione di Wittgenstein, che ci permette di eliminare ‘=’ da ogni proposizione in cui si verifica. Ma questo ci mette in una posizione disperata per quanto riguarda le classi, perché , avendo eliminato del tutto l’ ‘=’, non possiamo più usare x = y come funzione proposizionale nel definire delle classi finite. Così che le sole classi con cui siamo ora in grado di operare sono quelle definite dalle funzioni predicative.

Può essere utile qui ripetere la definizione di una funzione predicativa di particolari; è qualsiasi funzione verità di funzioni atomiche e di proposizioni atomiche. Chiamiamo tali funzioni ‘ predicative ‘ perché corrispondono, come quasi una nozione precisa possa esserlo di una vaga, all’idea che φa è predicato della stessa cosa di a come φb lo è di b . Essa comprende tutte le funzioni proposizionali che si verificano in Principia Mathematica, tra cui l’identità come ivi definita. E’ ovvio, comunque, che noi non dovremmo definire l’identità in questo modo, come accordo nei confronti di tutte le funzioni predicative, perché due cose possono chiaramente essere in accordo per quanto riguarda tutte le funzioni atomiche e quindi per quanto riguarda tutte le funzioni predicative, eppure si tratta di due cose e non, come la definizione proposta dell’identità comporterebbe, un solo oggetto.

Quindi la nostra teoria è altrettanto inadeguata dei Principia Mathematica a fornire una logica estensionale; infatti, se rifiutiamo questa falsa definizione dell’identità, non siamo in grado di includere tra le classi che che ne hanno a che fare anche con tutte le classi finite enumerate. La matematica diventa allora senza speranza perché non possiamo essere sicuri che ci sia una classe definita da una funzione predicativa il cui numero è due; perché gli oggetti possono tutti rientrare in triadi che si accordano in ogni aspetto, nel qual caso non ci sarebbero nel nostro sistema di classi di un membro né classi a due membri.

Se vogliamo preservare del tutto la forma ordinaria della matematica, sembra che qualche estensione deve essere fornita per la nozione di funzione proposizionale, in modo da comprendere pure altre classi. Una tale estensione è auspicabile per altri motivi, perché molti oggetti che sarebbe naturalmente essere considerati come funzioni proposizionali possono essere visti non essere funzioni predicative.

Per esempio

F ( x , y ) = Qualcosa di diverso da  x e y che soddisfa φz circonflesso

(Qui, naturalmente , ‘ diverso ‘ deve essere assunto in senso stretto, e non nel senso dei Principia Mathematica come ‘ distinguibile da ‘.)

 Questa non è una funzione predicativa, ma è costituita dalle parti di due funzioni predicative :

( 1 ) Per ( x ≠ y )

F ( x , y) è φx . φy : ⊃. Nc’z circonflesso ( φz ) ≥ 3 : . φx . ~ φy . v φy . ~ φx : ⊃ : Nc’z circonflesso ( φ z) ≥ 2 : . ~ φx . ~ φy : ⊃ : Nc’z circonflesso ( φz ) ≥ 1 .

 Questa è una funzione predicativa perché è una funzione verità di φx , φy e la proposizione costante Nc’z circonflesso ( φz ) > 1 , 2 , 3 , che non coinvolge x , y .

( 2) Per x = y

F ( x , x ) è φ ( x ) . ⊃. Nc’z circonflesso ( φz ) ≥ 2 : ~ φx . ⊃. Nc’z circonflesso ( φz ) ≥ 1 ,

che è una funzione predicativa .

Ma F ( x , y ) non è essa stessa una funzione predicativa; questo forse è più difficile da vedere. Ma è facile vedere che tutte le funzioni di questo tipo non possono essere predicative, perché se lo fossero saremmo riusciti a trovare una funzione predicativa soddisfatta solamente da ogni particolare a, che chiaramente in generale non può essere.

Perché supponiamo fa (se no, prendiamo ~ fSchermata 2013-08-22 alle 18.42.59 ) .

Sia       α = Schermata 2013-08-22 alle 18.42.59 ( fx ) ,

Β = α – ( a) .

Allora φx = ‘Non c’è niente che la soddisfa fx tranne x, e i membri di β ‘ si applicano ad a e solamente ad a. Quindi queste funzioni non possono essere mai predicative.

Proprio come F ( x , y ) di cui sopra, così anche ‘ x = y ‘ è costituita da due funzioni predicative :

( 1) Per x ≠ y

‘ x = y ‘ può essere assunto ad essere ( ∃φ ) . φx . ~ φx : ( ∃φ ) . φy . ~ φy , cioè una contraddizione.

( 2) Per x = y

‘ x = y ‘ può essere assunto essere ( φ ) : . φx . v . ~ φx : φy . v . ~ φy , cioè una tautologia.

Ma ‘ x = y ‘ non è di per sé predicativa .

Sembra, quindi , che dobbiamo introdurre funzioni propositive non-predicative. Come si deve fare? L’ unica via praticabile è quello di farlo nel modo più radicale e drastico possibile; far cadere del tutto la nozione che φa riguardi a quello che φb riguarda b; il trattare le funzioni propositive come funzioni matematiche, cioè, rendendole completamente estensionali. Infatti è chiaro che, essendo funzioni matematiche derivate da funzioni proposizionali, si deve avere un valore adeguatamente estensionale delle prime solo adottando un punto di vista completamente estensionale di queste ultime.

Quindi oltre al concetto precedentemente definito di una funzione predicativa, di cui avremo ancora bisogno per determinati scopi, definiamo, o meglio spieghiamo, nel nostro sistema che deve essere preso come indefinibile il nuovo concetto di una funzione proposizionale in estensione. Tale funzione di un particolare risulta da qualsiasi relazione uno-molti in estensione tra proposizioni e particolari; vale a dire, una correlazione, praticabile o impraticabile, che per ogni particolare associa una unica proposizione, essendo il particolare l’ argomento della funzione, la proposizione suo valore.

Così φ (Socrates) può essere che la regina Anne è morta ,

φ ( Platone ) potrebbe essere che   Einstein è un grand’uomo ;

φSchermata 2013-08-22 alle 18.42.59 essendo semplicemente una associazione arbitraria di proposizioni φx con particolari x .

Una funzione in estensione sarà caratterizzata da un suffisso e quindi φeSchermata 2013-08-22 alle 18.42.59.

 Quindi possiamo parlare della totalità di tali funzioni come la gamma di valori di una variabile  apparente φe.

Consideriamo ora ( φe ) . φex≣φey.

Questo afferma che in una tale correlazione la proposizione correlata con x è equivalente a quella correlata con y.

Se x = y è una tautologia (è il prodotto logico dei valori di p≣p ) .

Ma se x ≠ y è una contraddizione . Perché in una delle correlazioni alcuni p saranno associati ad x , e ~ p con y.

Allora perché questa correlazione feSchermata 2013-08-22 alle 18.42.59 , fex è p, fey è ~ p, così che fex ≣ fey è autoontraddittoria e ( φe) . φex ≣ φey è auto- contraddittoria .

Quindi ( φe ) . φe x ≣ φe y è una tautologia se x = y , una contraddizione se x ≠y.1

Quindi questa si può adeguatamente prendere come la definizione di x = y. x = y è una funzione in estensione di due variabili. Il suo valore è una tautologia , quando x e y hanno lo stesso valore , la contraddizione quando x , y hanno valori differenti.

Ora dobbiamo difendere questo insieme consigliato di funzioni per una variabile φe contro le accuse che è illegittimo e porta a contraddizioni. È legittimo perché è una notazione comprensibile, che fornisce un significato definito ai simboli in cui è utilizzata. Né può portare a contraddizioni perché sfugge alle contraddizioni che vengono in mente come fanno l’insieme delle funzioni predicative. Qualsiasi simbolo contenente la variabile φe significa in modo diverso da un simbolo che non la contiene, e avremo lo stesso tipo di ambiguità di ‘ significato ‘, come nel capitolo III, che rimuoverà le contraddizioni. Né può qualsiasi contraddizione del primo gruppo di contraddizioni essere ripristinata dalla nostra nuova notazione, perché sarà ancora impossibile per una classe di essere un membro di se stessa, come le nostre funzioni in estensione si limitano a tipi definiti di argomenti per definizione .

1 D’altra parte ( φ ) . φx≣ φy ( φ predicativo ) è una tautologia se x = y , ma non una contraddizione se x ≠ y.

Dobbiamo ora assumere le due nozioni che abbiamo definito, funzioni predicative e funzioni in estensione, e considerare quando avremo bisogno di usare l’una e quando l’altra.1 Prima prendiamo il caso in cui gli argomenti sono particolari: allora c’è ogni vantaggio nell’assumere che l’insieme di funzioni che usiamo in matematica sia quello di funzioni in estensione. Abbiamo visto come questo ci permette di definire l’identità in modo soddisfacente, ed è ovvio che non avremo bisogno di nessun Assioma di Riducibilità, perché qualsiasi funzione proposizionale ottenuta per generalizzazione, o in un qualsiasi modo, è una funzione in estensione. Inoltre ci darà una soddisfacente teoria delle classi, perché ogni classe sarà definita da una funzione in estensione, ad esempio dalla funzione che è tautologia per ogni membro della classe come argomento, ma contraddizione per qualsiasi altro argomento, e la classe nulla sarà definita dalla funzione di auto-contraddizione. Così la totalità delle classi può essere ridotta a quella di funzioni in estensione, e quindi sarà questa totalità che noi richiederemo in matematica, non la totalità delle funzioni predicative, che corrisponde non a ‘tutte le classi ‘, ma a ‘ tutti i predicati ‘ o ‘ tutte le proprietà’.

D’altra parte, quando si arriva a funzioni di funzioni la situazione è piuttosto diversa. Non sembra esserci nessuno scopo nel considerarne qualcuna tranne funzioni predicative di funzioni; le ragioni per l’introduzione di funzioni di estensione non sono più applicabili. Perché non abbiamo bisogno di definire l’identità tra funzioni, ma solo l’identità tra classi che si riduce ad equivalenza tra funzioni, che è facilmente definita. Né vogliamo considerare classi di funzioni, ma classi di classi, di cui è anche possibile un trattamento più semplice. Quindi, nel caso di funzioni di funzioni ci limitiamo a quelle che sono predicative.

1 Naturalmente funzioni predicative sono anche funzioni in estensione; la domanda è: che insieme vogliamo per la nostra funzione variabile.

Ricordiamo la definizione di una funzione predicativa di funzioni; è una funzione verità dei loro valori e proposizioni costanti.1 Tutte le funzioni di funzioni che compaiono in Principia sono di questo tipo , ma ‘ credo ( x ) . φx ‘ come una funzione φSchermata 2013-08-22 alle 18.42.59 non è. Le funzioni predicative di funzioni sono estensionali nel senso dei Principia , che se l’insieme di f ( fi circonflessoSchermata 2013-08-22 alle 18.42.59) è quello delle funzioni predicativi di funzioni .

φex ≣ x ψe x : ⊃: f ( φeSchermata 2013-08-22 alle 18.42.59 ) ≣ f ( ψe Schermata 2013-08-22 alle 18.42.59 )

Questo perché f ( φeSchermata 2013-08-22 alle 18.42.59 ) è una funzione verità dei valori di φex che sono equivalenti ai corrispondenti valori di ψe x , così che f ( φeSchermata 2013-08-22 alle 18.42.59 ) è equivalente a f ( ψe Schermata 2013-08-22 alle 18.42.59 ) .

Se abbiamo assunto questo dovremmo avere una semplice teoria delle classi, dal momento che non vi sarebbe alcun bisogno di distinguereSchermata 2013-08-22 alle 18.42.59 ( φex ) da  φeSchermata 2013-08-22 alle 18.42.59 . Ma sebbene sia una tautologia chiaramente non c’è modo di dimostrarlo, in modo che dovremmo assumerla come una proposizione primitiva. Se vogliamo evitarlo dobbiamo solo mantenere la teoria delle classi riportate nel Principia in base alla ” funzione estensionale derivata “. L’insieme di funzioni predicative di funzioni è adeguata ad affrontare le classi di classi, perché , sebbene , come abbiamo visto, ci possono essere classi di particolari che possono essere definite solo con funzioni di estensione, pure qualsiasi classe di classi può essere definita da una funzione predicativa , cioè da f ( α) dove

f ( φeSchermata 2013-08-22 alle 18.42.59 ) = Σψ ( φex º x ψex )

cioè la somma logica di ( φex≣ x ψex ) per tutte le funzioni ψex ^ che definiscono i membri della classe di classi.

1 Sono, credo, funzioni predicative di funzioni che Russell nell’Introduzione alla seconda edizione dei Principia cerca di descrivere come funzioni in cui le funzioni entrano solo attraverso i loro valori. Ma questa è chiaramente una descrizione insufficiente, perché φSchermata 2013-08-22 alle 18.42.59 entra solo in F(φSchermata 2013-08-22 alle 18.42.59) = ‘ io credo φa’ attraverso i suoi valori φa, ma questo non è certamente una funzione del tipo indicato, perché non è estensionale . Penso che il punto può essere spiegato, come ho fatto, solo con l’introduzione della nozione di funzione verità. Il sostenere, come fa Russell, che tutte le funzioni di funzioni sono predicative è intraprendere una disputa verbale inutile, a causa dell’ambiguità del vago termine funzioni di funzioni, che possono essere utilizzate per significare per esempio di essere predicative o di comprendere per esempio anche F ( φSchermata 2013-08-22 alle 18.42.59 ) come sopra.

Naturalmente , se la classe di classi è infinita, questa espressione non può essere scritta. Ma, tuttavia, esisterà la somma logica di queste funzioni, anche se non possiamo esprimerla.1

Quindi, per ottenere una teoria completa delle classi dobbiamo assumere che l’insieme di funzioni di particolari sia quello delle funzioni in estensione; ma che l’insieme delle funzioni di funzioni particolari sia quello delle funzioni predicative. Utilizzando queste variabili otteniamo il sistema dei Principia Mathematica, semplificato per l’omissione dell’Assioma di Riducibilità, e alcune modifiche corrispondenti. Formalmente è quasi inalterato, ma il suo significato è stato notevolmente cambiato. E nel preservare così la forma mentre si modifica l’interpretazione, sto seguendo la grande scuola dei logici matematici che, in virtù di una serie di definizioni sorprendenti, hanno salvato la matematica dagli scettici, e ha fornito una dimostrazione rigorosa delle sue proposizioni. Solo così possiamo preservarla dalla minaccia bolscevica di Brouwer e Weyl .

1 Una somma logica non è come una somma algebrica; solo un numero finito di termini può avere una somma algebrica, perché una ‘ somma infinita ‘ è in effetti un limite. Ma la somma logica di un insieme di proposizioni è la proposizione che queste non sono tutte false, ed esiste sia che l’insieme sia finito o che sia infinito.