Sillä saattaa olla pidemmät perinteet ja sitä varten ei ehkä kestäne kehitellä soveltuvia algoritmeja niin kauan, että tunnistetaan automaattisesti, mitä tekstejä kuvamuotoiseen tekstipohjaiseen aineistoon sisältyy kuin mitä on löydettävissä valokuvista. Tässä on esitelty huomioita liittyen a) tekstintunnistukseen kuvaskannauksista käyttäen ABBYY Cloud OCR SDK:ta, joka toimii niin luotettavan oloisesti kaikkiin lähinnä tekstiä sisältäviin kuviin, että se on jo otettu ns. production-käyttöön ("particular browsing"-näkymässä, kun tarkastelussa kuvan "large preview" -modaali-ikkunassa), sekä b) tekstintunnistukseen valokuvista käyttäen Cloudinaryn OCR-lisäosaa, joka itseasiassa käyttää suoraan Googlen Vision API:a. Sen tunnistamiset ovat toisinaan laatua "sehän onnistui hyvin", mutta usein pikemminkin "ei jukolaut, tämähän on ihan huono".

Tekstintunnistus tekstiä sisältävistä skannauksista

ABBYY:n tekstintunnistamisesta ei oikeastaan ole muuta kuin hyvää sanottavaa, sillä kaikki kuvaskannaukset (ja myös esim. screenshotit verkkosivuista), mitä sillä kokeili, tuottivat kelpo tuloksia. Sille ei voine paljoakaan, että tekstintunnistus tuottaa ylimääräisiä kirjainmerkkisiä artefakteja (eng. "anomalies apparent during visual representation"), mutta tätä pidettäköön hyväksyttävänä. Tekstintunnistukselle voi antaa parametreinä, minkä kielisiä tekstejä kuvasta pyritään etsimään.

444 VIL THE MECHANISM OF TIME-BINDING of it can be found by analysis practically everywhere. Our problem is to analyse the general case. Let us follow up roughly the process. We assume, for instance, an hypothetical case of an ideal observer who observes correctly and gives an impersonal, unbiased account of what he has observed. Let us assume that the happenings he has observed appeared as: O, and then a new happening ( occurred. At this level of observation, no speaking can be done, and, therefore, I use various fanciful symbols, and not words. The observer then gives a description of the above happenings, let us say a, b, c, d, . . . , x; then he makes an inference from these descriptions and reaches a con- clusion or forms a judgement A about these facts. Wc assume that facts unknown to him, which always exist, are not important in this case. Let us assume, also, that his conclusion seems correct and that the action A" which this conclusion motivates is appropriate. Obviously, we deal with at least three different levels of abstractions: the seen, experienced ., lower order abstractions (un-spcakable) ; then the descriptive level, and, finally, the inferential levels. Let us assume now another individual, Smiths ignorant of struc- ture or the orders of abstractions, of consciousness of abstracting, of s.r.; a politician or a preacher, let us say, a person who habitually iden- tifies, confuses his orders, uses inferential language for descriptions, and rather makes a business out of it. Let us assume that Smith, observes the 'same happenings’. He would witness the happenings O, |, ..... and the happening would appear new to him. The happenings O, be would describe in the form a, b, c, d, . . . , from which fewer descriptions he would form a judgement, reach a conclu- sion, B; which means that he would pass to another order of abstrac- tions. When the new happening occurs, he handles it with an already formed opinion B, and so his description of the happening ( is coloured by his older s.r and no longer the x of the ideal observer, but B(x) --- y. His description of ‘facts’ would not appear as the a, b, c, d, . . . , x, of the ideal observer but a, b, c, d,..., B(x) = y. Next he would abstract on a higher level, form a new judgement, about ‘facts’ a, b, c, d, . . . , B(x) =y, let us say, C. We see how the semantic error was produced. The happenings appeared the ‘same’, yet the unconscious identification of levels brought finally an entirely different conclusion to motivate a quite different action, A diagram will make this structurally clearer, as it is very difficult to explain this by words alone. On the Structural Differential it is shown without difficulty.

HIGHER ORDER ABSTRACTIONS 445 Seen happenings (un- IDEAL OBSERVER SMITH] speakable) (First order abstrac- tions) ............. Ik-5 .X Description III! I I I! I ( Second order abstrac- tions) ............. a, b, c, d, ... x a, b, c, d,... B(x)=y Inferences, conclusions, iqB and what not. I (Third order abstrac- tions) ............. A c Creeds and other se- I I mantic reactions.... A' c I Action A9 e Let us illustrate the foregoing with two clinical examples. In one case, a young boy persistently did not get up in the morning. In another case, a boy persistently took money from his mother’s pocketbook. In both cases, the actions were undesirable. In both cases, the parents unconsciously identified the levels, x was identified with B(x), and con- fused their orders of abstractions. In the first case, they concluded that the boy was lazy; in the second, that the boy was a thief. The parents, through semantic identification, read these inferences into every new ‘description’ of forthcoming facts, so that the parents’ new ‘facts’ became more and more semantically distorted and coloured in evaluation, and their actions more and more detrimental to all concerned. The general conditions in both families became continually worse, until the reading of inferences into descriptions by the ignorant parents produced a semantic background in the boys of driving them to murderous intents. A psychiatrist dealt with the problem as shown in the diagram of the ideal observer. The net result was that the one boy was not ‘lazy’, nor the other a ‘thief’, but that both were ill. After medical attention, of which the first step was to clarify the symbolic semantic situation, though not in such a general way as given here, all went smoothly. Two families were saved from crime and wreck. I may give another example out of a long list which it is unnecessary for our purpose to analyse, because as soon as the ‘consciousness of abstracting’ is acquired, the avoidance of these inherent semantic dif- ficulties becomes automatic. In a common fallacy of 'Petitio

Tekstintunnistus valokuvista

Kukaan ei pidä siitä, että menneisyydessä kenties hyvinkin merkittäviä sijainteja tuodaan valokuvitse näytille netin kaupunkikohtaisessa keskusteluryhmässä ihmisiä sillä tapaa yllättävästi, etteivät he ehdi suhteuttamaan tuntumaansa nykyhetkestä ja muistojaan menneisyydestä tavallaan tunkeileviin valokuviin, joiden sisältö ja herättelemät tuntemukset eivät ehkä ollenkaan täsmää havainnoijaan persoonana. Sen sijaan selityksissä, jossa pääpaino ei ole ollenkaan sijainneissa tai ajallisuudessa, vaste ei todennäköisesti ole niin vastentahtoinen. Täten, näitä pari vuosikymmentä sitten otettua valokuvaa voinee hyvinkin käyttää esittelemään tekstintunnistuksen onnistumista valokuviin kohdistettuna.

Kävipä kuitenkin niin, että käyttökelpoisuus tekstintunnistamiseen valokuvista aiheutti tuntuman, että tekstintunnistamiseen tarvitaan erikseen jonkin tekoälyn harjoituttamisesta algoritmeineen ja malleineen. Tässä on käytetty Cloudinaryn OCR-lisäosaa, joka käyttää varsinaisesti Googlen Vision API:a, eikä sille sen dokumentaation mukaan voi antaa kummoisempia parametrejä tekstintunnistamisen ohjaamiseksi, jos tekstit koostuvat pelkästään latinalaisista aakkosista eli analyysin tulokset ovat parasta, mitä on saatavilla. Alkuperäiset, analyysissä käytetyt kuvat ovat kooltaan 2015 x 1512 pikseliä. Googlen Vision API palauttaa analyysin tuloksena myös tiedot siitä, mistä kohdin kuvaa mikäkin teksti on löytynyt, mitä Cloudinary hyödyntää korostaakseen kuvista automaattisesti ne kohdat, missä tekstiä analyysin perusteella esiintyy. Cloudinaryn kanssa on käyty neuvotteluja siitä, voisiko tämän julkaisusovelluksen käyttäjälle saada erikoishinnoittelun OCR-toiminnallisuutta varten (saatavilla erikseen pyydettäessä).

BAR & CAFE,
HELIOS,
PI,
KAUPPAKESKO,
Tukip,
Billy JOKA PAIVA,
SELES,
PUB,