ਅਡੋਬ ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਇੱਕ ਪੇਪਰ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ ਹੈ ਜਿਸ ਵਿੱਚ ਇੱਕ ਨਵੇਂ ਨਕਲੀ ਬੁੱਧੀ (AI) ਮਾਡਲ ਦਾ ਵੇਰਵਾ ਦਿੱਤਾ ਗਿਆ ਹੈ ਜੋ ਇੱਕ ਡਿਵਾਈਸ ‘ਤੇ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਦਸਤਾਵੇਜ਼ਾਂ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਨ ਦੇ ਸਮਰੱਥ ਹੈ। ਪਿਛਲੇ ਹਫਤੇ ਪ੍ਰਕਾਸ਼ਿਤ, ਪੇਪਰ ਨੇ ਉਜਾਗਰ ਕੀਤਾ ਹੈ ਕਿ ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਮੌਜੂਦਾ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (LLMs) ਅਤੇ ਛੋਟੀ ਭਾਸ਼ਾ ਦੇ ਮਾਡਲਾਂ (SLMs) ਦੇ ਨਾਲ ਪ੍ਰਯੋਗ ਕੀਤਾ ਹੈ ਤਾਂ ਜੋ ਇਹ ਪਤਾ ਲਗਾਇਆ ਜਾ ਸਕੇ ਕਿ ਇਸਦੀ ਪ੍ਰੋਸੈਸਿੰਗ ਸਮਰੱਥਾ ਅਤੇ ਅਨੁਮਾਨ ਦੀ ਗਤੀ ਨੂੰ ਉੱਚ ਰੱਖਦੇ ਹੋਏ AI ਮਾਡਲ ਦੇ ਆਕਾਰ ਨੂੰ ਕਿਵੇਂ ਘਟਾਉਣਾ ਹੈ। ਖੋਜਕਰਤਾ, ਪ੍ਰਯੋਗਾਂ ਦੇ ਨਤੀਜੇ ਵਜੋਂ, ਇੱਕ AI ਮਾਡਲ ਨੂੰ SlimLM ਡਬ ਕਰਨ ਦੇ ਯੋਗ ਸਨ ਜੋ ਇੱਕ ਸਮਾਰਟਫੋਨ ਦੇ ਅੰਦਰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਦਸਤਾਵੇਜ਼ਾਂ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰ ਸਕਦਾ ਹੈ।
Adobe ਖੋਜਕਾਰ SlimLM ਵਿਕਸਿਤ ਕਰਦੇ ਹਨ
AI-ਸੰਚਾਲਿਤ ਦਸਤਾਵੇਜ਼ ਪ੍ਰੋਸੈਸਿੰਗ, ਜੋ ਕਿ ਇੱਕ ਚੈਟਬੋਟ ਨੂੰ ਇਸਦੀ ਸਮੱਗਰੀ ਬਾਰੇ ਉਪਭੋਗਤਾ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦੇਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੀ ਹੈ, ਜਨਰੇਟਿਵ AI ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਵਰਤੋਂ ਕੇਸ ਹੈ। ਅਡੋਬ ਸਮੇਤ ਬਹੁਤ ਸਾਰੀਆਂ ਕੰਪਨੀਆਂ ਨੇ ਇਸ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਟੈਪ ਕੀਤਾ ਹੈ ਅਤੇ ਇਸ ਕਾਰਜਸ਼ੀਲਤਾ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਨ ਵਾਲੇ ਟੂਲ ਜਾਰੀ ਕੀਤੇ ਹਨ। ਹਾਲਾਂਕਿ, ਅਜਿਹੇ ਸਾਰੇ ਸਾਧਨਾਂ ਵਿੱਚ ਇੱਕ ਮੁੱਦਾ ਹੈ – AI ਪ੍ਰੋਸੈਸਿੰਗ ਕਲਾਉਡ ‘ਤੇ ਹੁੰਦੀ ਹੈ। ਡੇਟਾ ਦੀ ਆਨ-ਸਰਵਰ ਪ੍ਰੋਸੈਸਿੰਗ ਡੇਟਾ ਗੋਪਨੀਯਤਾ ਬਾਰੇ ਚਿੰਤਾਵਾਂ ਪੈਦਾ ਕਰਦੀ ਹੈ ਅਤੇ ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਵਾਲੇ ਦਸਤਾਵੇਜ਼ਾਂ ਦੀ ਪ੍ਰੋਸੈਸਿੰਗ ਨੂੰ ਇੱਕ ਜੋਖਮ ਭਰੀ ਪ੍ਰਕਿਰਿਆ ਬਣਾਉਂਦੀ ਹੈ।
ਜੋਖਮ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਇਸ ਡਰ ਤੋਂ ਉੱਭਰਦਾ ਹੈ ਕਿ ਹੱਲ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਨ ਵਾਲੀ ਕੰਪਨੀ ਇਸ ‘ਤੇ AI ਨੂੰ ਸਿਖਲਾਈ ਦੇ ਸਕਦੀ ਹੈ, ਜਾਂ ਡੇਟਾ ਉਲੰਘਣਾ ਦੀ ਘਟਨਾ ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਦੇ ਲੀਕ ਹੋਣ ਦਾ ਕਾਰਨ ਬਣ ਸਕਦੀ ਹੈ। ਇੱਕ ਹੱਲ ਵਜੋਂ, ਅਡੋਬ ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਏ ਕਾਗਜ਼ ਔਨਲਾਈਨ ਜਰਨਲ arXiv ਵਿੱਚ, ਇੱਕ ਨਵੇਂ AI ਮਾਡਲ ਦਾ ਵੇਰਵਾ ਦਿੱਤਾ ਗਿਆ ਹੈ ਜੋ ਡਿਵਾਈਸ ‘ਤੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਦਸਤਾਵੇਜ਼ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰ ਸਕਦਾ ਹੈ।
ਡੱਬਡ SlimLM, AI ਮਾਡਲ ਦੇ ਸਭ ਤੋਂ ਛੋਟੇ ਵੇਰੀਐਂਟ ਵਿੱਚ ਸਿਰਫ਼ 125 ਮਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਹਨ ਜੋ ਇਸਨੂੰ ਇੱਕ ਸਮਾਰਟਫੋਨ ਦੇ ਓਪਰੇਟਿੰਗ ਸਿਸਟਮ ਵਿੱਚ ਜੋੜਿਆ ਜਾਣਾ ਸੰਭਵ ਬਣਾਉਂਦਾ ਹੈ। ਖੋਜਕਰਤਾਵਾਂ ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ ਇਹ ਇੰਟਰਨੈਟ ਕਨੈਕਟੀਵਿਟੀ ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ। ਨਤੀਜੇ ਵਜੋਂ, ਉਪਭੋਗਤਾ ਬਿਨਾਂ ਕਿਸੇ ਡਰ ਦੇ ਸਭ ਤੋਂ ਸੰਵੇਦਨਸ਼ੀਲ ਦਸਤਾਵੇਜ਼ਾਂ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰ ਸਕਦੇ ਹਨ ਕਿਉਂਕਿ ਡੇਟਾ ਕਦੇ ਵੀ ਡਿਵਾਈਸ ਨੂੰ ਨਹੀਂ ਛੱਡਦਾ।
ਪੇਪਰ ਵਿੱਚ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਉਜਾਗਰ ਕੀਤਾ ਕਿ ਉਹਨਾਂ ਨੇ ਪੈਰਾਮੀਟਰ ਆਕਾਰ, ਅਨੁਮਾਨ ਸਪੀਡ, ਅਤੇ ਪ੍ਰੋਸੈਸਿੰਗ ਸਪੀਡ ਵਿਚਕਾਰ ਸੰਤੁਲਨ ਲੱਭਣ ਲਈ ਸੈਮਸੰਗ ਗਲੈਕਸੀ S24 ‘ਤੇ ਕਈ ਪ੍ਰਯੋਗ ਕੀਤੇ। ਇਸ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣ ਤੋਂ ਬਾਅਦ, ਟੀਮ ਨੇ ਮਾਡਲ ਨੂੰ SlimPajama-627B ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ ‘ਤੇ ਪ੍ਰੀ-ਟੈਨ ਕੀਤਾ ਅਤੇ ਦਸਤਾਵੇਜ਼ ਪ੍ਰੋਸੈਸਿੰਗ ਲਈ ਇੱਕ ਵਿਸ਼ੇਸ਼ ਸੌਫਟਵੇਅਰ, DocAssist ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਸ ਨੂੰ ਵਧੀਆ ਬਣਾਇਆ।
ਖਾਸ ਤੌਰ ‘ਤੇ, arXiv ਇੱਕ ਪ੍ਰੀ-ਪ੍ਰਿੰਟ ਜਰਨਲ ਹੈ ਜਿੱਥੇ ਪ੍ਰਕਾਸ਼ਨ ਲਈ ਪੀਅਰ ਸਮੀਖਿਆਵਾਂ ਦੀ ਲੋੜ ਨਹੀਂ ਹੁੰਦੀ ਹੈ। ਇਸ ਤਰ੍ਹਾਂ, ਖੋਜ ਪੱਤਰ ਵਿੱਚ ਕੀਤੇ ਗਏ ਦਾਅਵਿਆਂ ਦੀ ਵੈਧਤਾ ਦਾ ਪਤਾ ਨਹੀਂ ਲਗਾਇਆ ਜਾ ਸਕਦਾ ਹੈ। ਹਾਲਾਂਕਿ, ਜੇਕਰ ਇਹ ਸੱਚ ਹੈ, ਤਾਂ AI ਮਾਡਲ ਨੂੰ ਭਵਿੱਖ ਵਿੱਚ Adobe ਦੇ ਪਲੇਟਫਾਰਮਾਂ ਨਾਲ ਭੇਜਿਆ ਜਾ ਸਕਦਾ ਹੈ।