ON THE HYPOTHESIS OF LIMITED VARIETY

19 Dic

Pacioli_2Propongo la traduzione di un appunto di Frank Ramsey riguardante l’ipotesi di varietà limitata con una critica alle tesi di J.M. Keynes sullo stesso argomento della teoria del calcolo probabilistico. La nota è stata pubblicata dalla prof.ssa Maria Carla Galavotti in Notes on Philosophy, Probabilitity and Mathamatics ed. Bibliopolis. Al termine riporto il testo in lingua originale.

SULL’IPOTESI DI VARIETÀ LIMITATA 1

Ottobre 1922

1 Si noti che  in questo saggio viene adottata la notazione  di Keynes. Pertanto, g/Hn sta per “la probabilità di g nell’ipotesi Hn“. Per quanto riguarda l’”Ipotesi di Varietà limitata” vedere J.M.Keynes, A Treatise on Probability, London: MacMillan, 1921, in particolare il cap. 22. Vedi anche il giudizio su questo libro di Ramsey in The Cambridge Magazine 11 (1922), pp. 3-5 , ristampato in British Journal for the Philosophy of Science 40 (1989), pp. 219-222.

Questa per prima cosa necessita di una correzione per renderla non equivalente al contraddittorio assioma dell’Infinito, che sarebbe inutile del tutto nell’induzione. (Questa osservazione accetta l’ Assioma di riducibilità). Per fare questo bisogna limitare le proprietà, a cui si applica, a quelle di un certo tipo, a cui quelle della nostra induzione(φ, f) devono appartenere, e a cui devono appartenere quelle delle analogie che si verificano in positivo e in negativo nei nostri esperimenti.

Poi propongo di metterla nella seguente forma che  probabilmente non è esattamente quella di Keynes, ma non sostanzialmente diversa da quella, ma più naturale e suscettibile di calcolo.

“Ogni proprietà di un dato tipo è equivalente in estensione ad alcune combinazioni logiche (funzione vere) di un numero finito di proprietà generatrici”.

Chiamerò questa ipotesi H. H insieme con l’affermazione che il numero di proprietà generatrici è n, la chiamerò Hn.

Keynes afferma che H determina una probabilità finita per g, la nostra generalizzazione φ x ⊃x fx , giustificherebbe così l’induzione pura. Questo lo nego e non riesco ad ammettere che tutto quello che dice lo dimostri; e credo che lo asserisca solo perché confonde H con Hn . Perché Hn determina una probabilità finita per g, se facciamo una certa applicazione del Principio di Indifferenza che Keynes sembra considerare come legittimo. Se ci sono n generatori di proprietà il numero di combinazioni di esse che un oggetto può avere è N = 2n.

Quindi l’estensione ad Hn di qualsiasi adatta proprietà deve consistere di un certo numero di classi N (o sarebbe nulla) . Quindi le estensioni di φ , f possono essere scelte in 2N ⋅ 2N = 4N modi e  3N di queste saranno quelle di f che includono quelle di φ. Quindi g/Hn = (3/4)N finito per qualsiasi n.

Ma non possiamo concludere da questo che g/H è finito, anche se potrebbe se g/ Hn fosse stato > ε > 0 per ogni n; perché allora dovremmo avere anche g/H> ε; ma g/Hn → 0 per n → ∞ così l’inferenza non sarebbe possibile.

Questo porta a termine l’unico metodo che posso considerare che dimostri che H sarebbe di qualche utilizzo in una qualunque induzione. Ma Hn si considera essere molto utile nell’esaminare più delle sue conseguenze.

Vedremo che ciò giustifica una regola che somiglia alla Regola di Laplace delle Successioni, e il metodo di ragionamento dall’analogia come esposta da Keynes.

La regola di successione dedotta da Hn.  φ , f supposti semplici. Se p di φ ha  dimostrato  f, richiede che  le probabilità che  una p + 1a ci sarà, e che tutte le φ sono f (p ≥ 1)

Ci sono N classi che devono essere prese nel loro insieme o lasciate nel formare l’estensione di una qualche proprietà.

Se p di Φ sono f; allora  r classi, essendo entrambe sia φ sia f, possono essere scelte in

Schermata 2013-12-02 alle 21.52.11

modi, le p distribuite tra queste in pr modi e le restanti N – r classi divise in φ Schermata 2013-12-02 alle 21.56.47     , f   Schermata 2013-11-09 alle 20.44.22Schermata 2013-12-02 alle 21.56.47 Schermata 2013-11-09 alle 20.44.22                  in 3N -r modi.

∴ il numero dei casi consentiti dalla ” p di φ che sono f ” è

Schermata 2013-12-02 alle 22.00.58 traduzione

∴ la probabilità che la p + 1th  φ  sia un f è

Schermata 2013-12-02 alle 22.08.08

e questa è la regola della successione. Ciò aumenta con p e → 1 per p → ∞ .

Extra – casi  di p + 1th potrebbero esserci per ipotesi in qualsiasi classe.

Il numero dei casi consentiti dalla ” p di φ sono di f ” ” tutti i φ sono f” si vede da un calcolo simile al precedente (unica differenza solo f  Schermata 2013-11-09 alle 20.44.22   ,  Schermata 2013-11-09 alle 20.44.22Schermata 2013-12-02 alle 21.56.47  ,   non φ Schermata 2013-12-02 alle 21.56.47   )  sarebbe φ (N,2 ,p ).

∴ La probabilità che tutti i φ sono f è

Schermata 2013-12-02 alle 22.07.39

aumenta anche con p e → 1 per p → ∞ .

Quindi Hn è sufficiente per giustificare la generalizzazione per pura induzione.

Inoltre è sufficiente a giustificare i metodi di analogia. Per una analogia supplementare positiva tra i nostri casi dà una probabilità che questi  sarebbero limitati a meno delle N classi che una distribuzione normale darebbe, e le analogie negative hanno l’effetto contrario. Dobbiamo naturalmente supporre N grande in confronto al numero di osservazioni che siamo in grado di fare .

Ma Hn non fornisce alcun sostegno al Metodo della Differenza di Mill.

Questo metodo consiste nell’osservare due casi uno dei φ f , un altro di  Schermata 2013-11-09 alle 20.44.22 Schermata 2013-12-02 alle 21.56.47      (entrambi i quali supportano φ ⊃ f), e immaginando che la loro influenza favorevole aumenta se questi casi concordano, a parte f, φ, per quanto possibile; questo è il metodo di variare un fattore alla volta . Ma per Hn l’unico modo che le somiglianze e le differenze tra i nostri esempi determinano è di alterare la loro probabile distribuzione fra le N classi, che è sempre aumentata dalle differenze, e diminuita dalla concordanza, tra i vari casi, se questi sono di φ f , o Schermata 2013-11-09 alle 20.44.22 Schermata 2013-12-02 alle 21.56.47  .

Possiamo notare che per la validità di una pura correlazione induttiva cioè per ottenere g/n finita, abbiamo solo bisogno Hn/n finito per qualche n; ma questo ovviamente non è il caso per la giustificazione degli altri metodi, che sembrano aver bisogno dell’assunzione assoluta di alcuni Hn .

Ma questo non è davvero così dovuto a causa della possibilità di rafforzare un’ipotesi induttiva con l’esperienza, sottolineata da Keynes . Questo possiamo stabilire con un argomento più semplice di quello di Keynes e formalmente rigoroso. Questo.

Sia H un ipotesi induttiva ; h la nostra totale conoscenza.

Supponiamo q sia un evento previsto per induzione cioè q / Hh  > q / h .

Dividiamo ciascun membro per qH / h

∴ H / h < H / qh cioè q che ne esce rafforza la probabilità di H.

In conclusione sembra che la necessità di sostituire alcuni Hn con H fa sembrare l’intera questione incredibilmente arbitraria.

Né alcun sostegno si potrebbe trarre dal presunto collegamento di H con l’Ipotesi dell’Uniformità Atomica, perché questa sembra meno una premessa per l’induzione, che un fatto sulla natura (scoperto per induzione ), da cui dipende non la ragionevolezza dell’induzione, ma la sua utilità pratica .

Anche l’induzione sarebbe molto più soddisfacentemente giustificata da un principio induttivo che da una ipotesi induttiva. Il dire che coloro che usano l’induzione sono ragionevoli perché conoscono inconsciamente alcune grandi realtà della natura, necessariamente molto complicate, come dimostra il fallimento di tutti i tentativi di formularle, è appena sufficiente. Sarebbe molto meglio capire che il procedimento induttivo è ragionevole in se stesso, in virtù di qualche principio probabilistico, con la posizione logica del Principio di Indifferenza. Ma come affermare questo ignoto Principio Induttivo è una questione molto difficile.

Questo è il testo in lingua originale:

ON THE HYPOTHESIS OF LIMITED VARIETY1

October 1922

1 Note that Keynes’ notation is adopted throughout this essay. Accordingly, g/Hn stands for “the probability of g on hypothesis Hn”. As to the “Hypothesis of Limited Variety” see  Keynes, A Treatise on Probability, London: MacMillan, 1921, especially Ch. 22. See also the review of this book by Ramsey in The Cambridge Magazine 11 (1922), pp. 3-5, reprinted in British Journal for the Philosophy of Science 40 (1989), pp. 219-222.

This first needs amendment to make it not equivalent to the contradictory of the Axiom of Infinity, which would be no use in Induction at all. (This remark assumes the Axiom of Reducibility). To do this we must limit the properties, to which it is to apply, to those of a certain kind, to which those of our induction (φ, f) must belong, and to which those of the analogies positive and negative occurring in our evidence should belong.

Next I propose to state it in the following form probably not exactly that of Keynes, but not seriously different from it, and more natural and amenable to calculation.

“Every property of the given kind is equivalent in extension to some logical combination (truth function) of a finite number of generator properties”.

This hypothesis I shall call H. H together with the assertion that the number of generator properties is n, I shall call Hn.

Keynes asserts that H gives a finite probability to g, our generalisation φ x ⊃x fx, and so justifies pure induction. This I deny and I cannot see that anything he says supports it; and I believe he only asserts it because he confuses H and Hn. For Hn does give a finite probability to g, if we make a certain application of the Principle of Indifference which Keynes appears to regard as legitimate. If there are n generator properties the number of combinations of them an object can have is N = 2n.

Hence on Hn the extension of any suitable property must consist of a certain number of N classes (or be null). Hence the extensions of φ, f can be chosen in 2N ⋅ 2N = 4N ways and in 3N of these will that of f include that of φ. Hence g/Hn = (3/4)N finite for all n.

But we cannot conclude from this that g/H is finite, though we could do so if g/Hn was > ε > 0 for all n; for then we should have g/H > ε also; but g/Hn → 0 as n → ∞ so the inference is not possible.

This closes the only method I can see of showing that H would be any use in induction whatever. But Hn is seen to be very useful by examining more of its consequences.

We shall see that it justifies a rule resembling Laplace’s Rule of Succession, and the method of reasoning from analogy as expounded by Keynes.

Rule of succession deduced from Hn . φ, f supposed simple. If p φ’s have proved f’s, required the chances that a p + 1th will, and that all φ’s are f’s (p ≥ 1)

There are N classes which must be taken as a whole or left in forming the extension of any property.

If p φ’s are f’s; then r classes, to be both φ’s and f’s, can be  chosen in

Schermata 2013-12-02 alle 21.52.11

ways, the p distributed among them in pr ways and the remaining N-r classes divided into φ  Schermata 2013-12-02 alle 21.56.47   , f   Schermata 2013-11-09 alle 20.44.22   ,  Schermata 2013-12-02 alle 21.56.47 Schermata 2013-11-09 alle 20.44.22      in 3N-r ways.

∴ the number of cases allowed by “p φ’s are f’s” is

Schermata 2013-12-02 alle 22.00.58

∴ the probability that the p + 1th  φ  is an f is

Schermata 2013-12-02 alle 22.08.08

and this is the rule of succession. This increases with p and → 1 as p → ∞.

Extra-cases p + 1th may be on hypothesis in any class.

The number of cases allowed by “p φ’s are f ’s” “all φ’s are f’s” is seen by calculation similar to the above (only difference only  f  Schermata 2013-11-09 alle 20.44.22     ,   Schermata 2013-12-02 alle 21.56.47 Schermata 2013-11-09 alle 20.44.22      not φ   Schermata 2013-12-02 alle 21.56.47   ) to be φ (N, 2, p).

∴ Probability that all φ’s are f’s is

Schermata 2013-12-02 alle 22.07.39

also increases with p and → 1 as p → ∞.

Hence Hn is adequate to justify generalisation by pure induction.

Further it is adequate to justify the methods of analogy. For extra positive analogy among our instances gives a probability that they are confined to fewer of the N classes than a normal distribution would give, and negative analogies have the contrary effects. We must of course suppose N large in comparison with the number of observations we are able to make.

But Hn yields no support to Mill’s Method of Difference.

This method_consists in observing two instances one of φ f, another of  Schermata 2013-11-09 alle 20.44.22 Schermata 2013-12-02 alle 21.56.47   (both of which support φ ⊃ f) and imagining that their favourable influence is heightened if these instances agree, apart from f, φ as far as possible; it is the method of varying one factor at a time. But on Hn the only way that resemblances and differences between our instances matter is by altering their probable distribution among the N classes, which is always increased by differences, and decreased by agreements, between the instances, whether these are of  φ f, or of   Schermata 2013-11-09 alle 20.44.22 Schermata 2013-12-02 alle 21.56.47 .

We may notice that for the validity of pure inductive correlation i.e. to get g/n finite, we only need Hn/n finite for some n; but this is not obviously the case for the justification of the other methods, which appear to need the absolute assumption of some Hn

But this is not really so owing to the possibility of strengthening an inductive hypothesis by experience, pointed out by Keynes. This we can establish by an argument simpler than that of Keynes and formally rigorous. Thus.

Let H be an inductive hypothesis; h our total knowledge.

Suppose q to be an event foretold by induction i.e. q/Hh > q/h.

Divide each side into qH/h

 ∴ H/h < H/qh i.e. q coming off strengthens the probability of H.

In conclusion it seems that the necessity of substituting some Hn, for H makes the whole thing seem impossibly arbitrary.

Nor can any support be drawn from the supposed connection of H with the Hypothesis of Atomic Uniformity, because this seems less a premiss in induction, than a fact about nature (discovered by induction) on which depends not the reasonableness of induction but its practical utility.

Also induction would be far more satisfactorily justified by an inductive principle than by an inductive hypothesis. To say that those who use induction are reasonable because they know subconsciously some big fact about nature, necessarily very complicated, as is shown by the failure of all attempts to formulate it, is hardly good enough. It would be far better to make out that inductive procedure is reasonable in itself, in virtue of some principle of probability, with the logical status of the Principle of Indifference. But how to state this unknown Inductive Principle is a matter of great difficulty.

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: