ਡਿਜੀਓ ਬੁਨਿਆਦੀ ਢਾਂਚਾ

AI ਮਾਡਲ ਅਤੇ GPU

ਅੱਜ ਪ੍ਰਬੰਧਿਤ ਫਰੰਟੀਅਰ ਮਾਡਲਾਂ 'ਤੇ ਏਜੰਟ ਚਲਾਓ—ਜਾਂ GPU ਸਮਰੱਥਾ ਕਿਰਾਏ 'ਤੇ ਲਓ, ਆਪਣੇ ਖੁਦ ਦੇ ਵਜ਼ਨ ਲਗਾਓ, ਅਤੇ ਉਸੇ ਵਰਕਸਪੇਸ ਵਿੱਚ ਡਿਜੀਓ ਕਾਰਜਾਂ ਨੂੰ ਪ੍ਰਾਈਵੇਟ ਐਂਡਪੁਆਇੰਟਾਂ ਤੱਕ ਰੂਟ ਕਰੋ।

ਕਲਾਉਡ, GPT, Gemini ਪ੍ਰਤੀ-ਏਜੰਟ ਮਾਡਲ ਦੀ ਚੋਣ GPU ਰੈਂਟਲ ਅਤੇ BYOM
ਪ੍ਰਬੰਧਿਤ ਮਾਡਲ

ਮਾਡਲ ਅੱਜ ਡਿਜੀਓ ਵਿੱਚ ਉਪਲਬਧ ਹਨ

ਪ੍ਰਤੀ ਏਜੰਟ ਜਾਂ ਪ੍ਰਤੀ ਕਾਰਜ ਨੂੰ ਓਵਰਰਾਈਡ ਕਰਨ ਲਈ ਇੱਕ ਡਿਫੌਲਟ ਮਾਡਲ ਨਿਰਧਾਰਤ ਕਰੋ। ਤੁਹਾਡੇ ਪਲਾਨ ਬੈਲੇਂਸ ਤੋਂ ਡਿਜੀਓ ਟੋਕਨਾਂ ਵਿੱਚ ਵਰਤੋਂ ਨੂੰ ਮਾਪਿਆ ਜਾਂਦਾ ਹੈ—ਉਹੀ ਵਾਲਿਟ ਭਾਵੇਂ ਏਜੰਟ ਸੋਨੈੱਟ, GPT-4o, ਜਾਂ ਜੇਮਿਨੀ ਫਲੈਸ਼ ਨੂੰ ਕਾਲ ਕਰਦਾ ਹੈ।

ਐਂਥ੍ਰੋਪਿਕ ਕਲੌਡ

  • Claude Opus 4.7 ਫਲੈਗਸ਼ਿਪ ਤਰਕ, ਲੰਬੇ ਸੰਦਰਭ, ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਰਣਨੀਤੀ ਦਾ ਕੰਮ।
  • Claude Opus 4.6 ਸਥਿਰ, ਉੱਚ-ਗੁਣਵੱਤਾ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਪਿਛਲੀ ਪੀੜ੍ਹੀ ਦਾ ਓਪਸ।
  • Claude Sonnet 4.6 ਰੋਜ਼ਾਨਾ ਡਰਾਈਵਰ—ਕੋਡਿੰਗ, ਰਾਈਟਿੰਗ, ਅਤੇ ਮਲਟੀ-ਸਟੈਪ ਏਜੰਟ ਲੂਪਸ।
  • Claude Sonnet 4.5 / 4 ਸਮਰਥਿਤ ਵਰਕਲੋਡਾਂ 'ਤੇ ਪ੍ਰੋਂਪਟ ਕੈਸ਼ਿੰਗ ਦੇ ਨਾਲ ਤੇਜ਼ ਸਨੇਟ ਟੀਅਰ।
  • Claude Haiku 4.5 ਘੱਟ-ਲੇਟੈਂਸੀ ਡਰਾਫਟ, ਵਰਗੀਕਰਨ, ਅਤੇ ਉੱਚ-ਆਵਾਜ਼ ਵਾਲੇ ਉਪ-ਕਾਰਜ।

ਸ਼ਾਬਦਿਕ ਅਨੁਵਾਦ ਕਰੋ: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 ਆਮ ਅਤੇ ਏਜੰਟਿਕ ਵਰਕਲੋਡ ਲਈ ਨਵੀਨਤਮ GPT-5 ਪਰਿਵਾਰ।
  • GPT-4.1 & GPT-4o ਉਤਪਾਦਨ ਏਜੰਟਾਂ ਲਈ ਭਰੋਸੇਯੋਗ ਮਲਟੀਮੋਡਲ ਚੈਟ ਅਤੇ ਟੂਲ ਦੀ ਵਰਤੋਂ।
  • GPT-4o mini ਸਾਰਾਂਸ਼ਾਂ ਅਤੇ ਹਲਕੇ ਕਦਮਾਂ ਲਈ ਲਾਗਤ-ਕੁਸ਼ਲ ਰੂਟਿੰਗ।
  • o3 / o3-pro / o3-mini / o4-mini ਗਣਿਤ, ਯੋਜਨਾਬੰਦੀ, ਅਤੇ ਤਸਦੀਕ ਲਈ ਤਰਕ-ਕੇਂਦ੍ਰਿਤ ਮਾਡਲ।
  • GPT-5.3 Codex & Codex mini ਕੋਡ ਜਨਰੇਸ਼ਨ, ਰਿਫੈਕਟਰ, ਅਤੇ ਰੇਪੋ-ਜਾਗਰੂਕ ਏਜੰਟ ਹੁਨਰ।

ਸ਼ਾਬਦਿਕ ਅਨੁਵਾਦ ਕਰੋ: Google Gemini

  • Gemini 2.5 Pro ਲੰਬੇ-ਸੰਦਰਭ ਖੋਜ ਅਤੇ ਢਾਂਚਾਗਤ ਕੱਢਣ।
  • Gemini 2.5 Flash ਪ੍ਰਤੀਯੋਗੀ ਟੋਕਨ ਦਰਾਂ ਦੇ ਨਾਲ ਉੱਚ-ਥਰੂਪੁੱਟ ਏਜੰਟ ਕਦਮ।
  • Gemini 2.0 Flash ਪਾਰਸਿੰਗ, ਟੈਗਿੰਗ ਅਤੇ ਬੈਚ ਦੀਆਂ ਨੌਕਰੀਆਂ ਲਈ ਅਤਿ-ਤੇਜ਼ ਪਾਸ।

ਓਪਨ ਅਤੇ ਮਾਹਰ APIs

  • DeepSeek Chat & Reasoner ਚੈਟ ਅਤੇ ਚੇਨ-ਆਫ-ਥੌਟ ਸ਼ੈਲੀ ਦੇ ਕੰਮਾਂ ਲਈ ਮਜ਼ਬੂਤ ​​ਮੁੱਲ।
  • Mistral Large ਬਹੁਭਾਸ਼ਾਈ ਏਜੰਟ ਟੀਮਾਂ ਲਈ ਯੂਰਪੀਅਨ-ਮੇਜ਼ਬਾਨੀ ਵਿਕਲਪ।
  • Llama 3.3 70B API ਦੁਆਰਾ ਓਪਨ-ਵੇਟਸ ਕਲਾਸ ਮਾਡਲ—ਪ੍ਰਾਈਵੇਟ GPU ਨਾਲ ਚੰਗੀ ਤਰ੍ਹਾਂ ਪੇਅਰ ਕਰਦਾ ਹੈ।
  • Grok 3 ਖ਼ਬਰਾਂ ਅਤੇ ਸਮਾਜਿਕ ਨਿਗਰਾਨੀ ਏਜੰਟਾਂ ਲਈ ਰੀਅਲ-ਟਾਈਮ ਓਰੀਐਂਟਿਡ ਮਾਡਲ।
  • Sonar Pro ਖੋਜ ਏਜੰਟਾਂ ਲਈ ਖੋਜ ਆਧਾਰਿਤ ਜਵਾਬ।
  • Command R+ RAG-ਅਨੁਕੂਲ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਚੈਟ ਅਤੇ ਮੁੜ ਪ੍ਰਾਪਤੀ ਵਰਕਫਲੋ।

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

ਵਰਤੋਂ

ਏਜੰਟ ਕਿਵੇਂ ਮਾਡਲ ਚੁਣਦੇ ਹਨ

ਕੋਆਰਡੀਨੇਟਰ ਕੰਮ ਦੀ ਕਿਸਮ ਦੇ ਆਧਾਰ 'ਤੇ ਸਨੇਟ ਬਨਾਮ ਓਪਸ ਬਨਾਮ ਸਸਤੇ ਫਲੈਸ਼ ਮਾਡਲ ਦੀ ਸਿਫ਼ਾਰਸ਼ ਕਰ ਸਕਦਾ ਹੈ। ਪਾਵਰ ਉਪਭੋਗਤਾਵਾਂ ਨੇ ਪ੍ਰਤੀ ਏਜੰਟ ਰੋਲ ਡਿਫਾਲਟ ਸੈੱਟ ਕੀਤਾ-ਸੋਨੇਟ 'ਤੇ ਖੋਜ, ਓਪਸ 'ਤੇ ਅੰਤਿਮ ਸਮੀਖਿਆ, ਹਾਇਕੂ ਜਾਂ ਜੈਮਿਨੀ ਫਲੈਸ਼ 'ਤੇ ਬਲਕ ਟੈਗਿੰਗ।

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU ਰੈਂਟਲ

GPU ਕਿਰਾਏ 'ਤੇ ਲਓ ਅਤੇ ਆਪਣੇ ਖੁਦ ਦੇ ਮਾਡਲ ਚਲਾਓ

ਇੱਕ ਫਾਈਨ-ਟਿਊਨ, ਇੱਕ ਏਅਰ-ਗੈਪਡ ਚੈਕਪੁਆਇੰਟ, ਜਾਂ ਅਨੁਮਾਨ ਲਗਾਉਣ ਯੋਗ ਅਨੁਮਾਨ ਕੀਮਤ ਦੀ ਲੋੜ ਹੈ? ਆਪਣੇ ਡਿਜੀਓ ਵਰਕਸਪੇਸ ਵਿੱਚ ਸਮਰਪਿਤ GPU ਸਮਰੱਥਾ ਸ਼ਾਮਲ ਕਰੋ, ਆਪਣੀ ਪਸੰਦ ਦੇ ਸਰਵਿੰਗ ਸਟੈਕ ਨੂੰ ਸਥਾਪਿਤ ਕਰੋ, ਅਤੇ ਆਪਣੇ ਨਿਜੀ ਅੰਤਮ ਬਿੰਦੂ 'ਤੇ ਪੁਆਇੰਟ ਏਜੰਟ।

ਸਮਰਪਿਤ ਉਦਾਹਰਨਾਂ

ਘੰਟਾਵਾਰ ਜਾਂ ਮਹੀਨਾਵਾਰ GPU ਨੋਡਸ (A100, H100, L40S ਕਲਾਸ) ਤੁਹਾਡੇ ਕਿਰਾਏਦਾਰ ਨਾਲ ਜੁੜੇ—ਹੋਰ ਗਾਹਕਾਂ ਤੋਂ ਅਲੱਗ।

ਤੁਹਾਡਾ ਵਜ਼ਨ

ਸੇਫਟੈਂਸਰ, GGUF, ਜਾਂ ਆਪਣੀ ਰਜਿਸਟਰੀ ਤੋਂ ਪੁੱਲ ਅੱਪਲੋਡ ਕਰੋ; Llama, Mistral, Qwen, ਅਤੇ ਕਸਟਮ ਫਾਈਨ-ਟੂਨਸ ਚਲਾਓ।

ਮਿਆਰੀ ਸੇਵਾ

vLLM, TGI, ਓਲਾਮਾ, ਜਾਂ ਕੰਟੇਨਰ ਚਿੱਤਰ ਜੋ ਤੁਸੀਂ ਸੰਭਾਲਦੇ ਹੋ—Digio ਏਜੰਟ ਇੱਕ OpenAI- ਅਨੁਕੂਲ ਅਧਾਰ URL ਨੂੰ ਕਾਲ ਕਰਦੇ ਹਨ।

ਉਹੀ ਆਰਕੈਸਟਰਾ

ਕਰਨ ਲਈ, ਟੀਮ ਚੈਟ, ਹੁਨਰ, ਅਤੇ ਸਹਿਯੋਗ ਵਿੱਚ ਕੋਈ ਬਦਲਾਅ ਨਹੀਂ ਹੈ—ਸਿਰਫ਼ ਅਨੁਮਾਨ ਬੈਕਐਂਡ ਤੁਹਾਡਾ ਹੈ।

ਹਾਈਬ੍ਰਿਡ ਰੂਟਿੰਗ

ਨਿੱਜੀ GPU ਨੂੰ ਸੰਵੇਦਨਸ਼ੀਲ ਕਦਮ ਭੇਜੋ ਅਤੇ ਇੱਕ ਵਰਕਫਲੋ ਵਿੱਚ ਜਨਤਕ ਖੋਜ ਲਈ ਕਲਾਉਡ ਜਾਂ GPT ਦੀ ਵਰਤੋਂ ਕਰੋ।

ਐਂਟਰਪ੍ਰਾਈਜ਼ ਨਿਯੰਤਰਣ

ਨਿਯੰਤ੍ਰਿਤ ਟੀਮਾਂ ਲਈ VPC ਪੀਅਰਿੰਗ, ਸਥਿਰ ਨਿਕਾਸੀ, ਆਡਿਟ ਲੌਗ, ਅਤੇ ਮਾਡਲ ਅਨੁਮਤੀ ਸੂਚੀਆਂ।

ਆਪਣਾ ਖੁਦ ਦਾ ਮਾਡਲ ਲਿਆਓ

ਇੱਕ ਕਸਟਮ ਮਾਡਲ ਸਥਾਪਤ ਕਰੋ ਅਤੇ ਕਨੈਕਟ ਕਰੋ

ਤੁਹਾਡੇ ਅੰਤਮ ਬਿੰਦੂ ਨੂੰ ਕਾਲ ਕਰਨ ਵਾਲੇ ਏਜੰਟਾਂ ਤੱਕ ਜ਼ੀਰੋ ਤੋਂ ਆਮ ਸੈੱਟਅੱਪ:

  1. ਰਿਜ਼ਰਵ GPU

    VRAM, ਖੇਤਰ, ਅਤੇ ਅਪਟਾਈਮ (ਬਰਸਟ ਬਨਾਮ ਹਮੇਸ਼ਾ-ਚਾਲੂ) ਚੁਣੋ। ਉਦਾਹਰਨ ਦੇ ਨਾਲ ਵਜ਼ਨ ਜਹਾਜ਼ਾਂ ਲਈ ਸਟੋਰੇਜ ਜਾਂ ਤੁਹਾਡੀ ਬਾਲਟੀ ਨੂੰ ਮਾਊਂਟ ਕਰਦਾ ਹੈ।

  2. ਸਟੈਕ ਤਾਇਨਾਤ ਕਰੋ

    ਵਿੱਚ ਇੱਕ ਸਰਵਿੰਗ ਚਿੱਤਰ ਜਾਂ SSH ਸ਼ੁਰੂ ਕਰੋ, CUDA ਡਰਾਈਵਰ ਸਥਾਪਿਤ ਕਰੋ, ਅਤੇ ਚੈੱਕਪੁਆਇੰਟ ਲੋਡ ਕਰੋ। ਸਿਹਤ ਜਾਂਚਾਂ ਨੇ ਪੁਸ਼ਟੀ ਕੀਤੀ ਕਿ ਮਾਡਲ ਤਿਆਰ ਹੈ।

  3. ਅੰਤਮ ਬਿੰਦੂ ਰਜਿਸਟਰ ਕਰੋ

    ਵਰਕਸਪੇਸ ਸੈਟਿੰਗਾਂ ਵਿੱਚ ਅਧਾਰ URL, API ਕੁੰਜੀ, ਅਤੇ ਮਾਡਲ ਆਈਡੀ ਸ਼ਾਮਲ ਕਰੋ। ਡਿਜੀਓ ਲਾਈਵ ਹੋਣ ਤੋਂ ਪਹਿਲਾਂ ਲੇਟੈਂਸੀ ਅਤੇ ਟੋਕਨ ਫਾਰਮੈਟ ਨੂੰ ਪ੍ਰਮਾਣਿਤ ਕਰਦਾ ਹੈ।

  4. ਏਜੰਟਾਂ ਨੂੰ ਸੌਂਪੋ

    ਚੁਣੇ ਹੋਏ ਏਜੰਟਾਂ ਲਈ ਆਪਣੇ ਨਿੱਜੀ ਮਾਡਲ ਨੂੰ ਡਿਫੌਲਟ ਵਜੋਂ ਚੁਣੋ; ਪ੍ਰਬੰਧਿਤ ਕਲਾਉਡ/GPT ਮਾਡਲ ਨਾਲ-ਨਾਲ ਉਪਲਬਧ ਰਹਿੰਦੇ ਹਨ।

GPU ਰੈਂਟਲ ਦਾ ਬਿਲ ਡਿਜੀਓ ਪਲਾਨ ਗਾਹਕੀਆਂ ਤੋਂ ਵੱਖਰੇ ਤੌਰ 'ਤੇ ਲਿਆ ਜਾਂਦਾ ਹੈ। ਸਮਰੱਥਾ ਦੀ ਯੋਜਨਾਬੰਦੀ, SLAs, ਅਤੇ ਮੌਜੂਦਾ ਅਨੁਮਾਨ ਕਲੱਸਟਰ ਤੋਂ ਮਾਈਗ੍ਰੇਸ਼ਨ ਲਈ ਸਾਡੇ ਨਾਲ ਸੰਪਰਕ ਕਰੋ।

B2B SaaS ਵੈੱਬਸਾਈਟ UI ਲੇਬਲ। ਕੁਦਰਤੀ pa ਵਿੱਚ ਅਨੁਵਾਦ ਕਰੋ: ਅਕਸਰ ਪੁੱਛੇ ਜਾਣ ਵਾਲੇ ਸਵਾਲ

ਮਾਡਲ ਅਤੇ GPU ਸਵਾਲ

ਡਿਜੀਓ 'ਤੇ ਪ੍ਰਬੰਧਿਤ APIs ਬਨਾਮ ਸਵੈ-ਹੋਸਟ ਕੀਤੇ ਅਨੁਮਾਨ ਦੀ ਚੋਣ ਕਰਨਾ।

ਕੀ ਮੈਂ ਦੋ ਵਾਰ ਭੁਗਤਾਨ ਕਰਦਾ ਹਾਂ—ਪਲਾਨ ਪਲੱਸ API?

ਤੁਹਾਡੀ ਡਿਜੀਓ ਗਾਹਕੀ ਬੁਨਿਆਦੀ ਢਾਂਚੇ, ਏਜੰਟਾਂ, ਅਤੇ ਡਿਜੀਓ ਟੋਕਨਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਦੀ ਹੈ। ਪ੍ਰਬੰਧਿਤ ਮਾਡਲ ਵਰਤੋਂ ਡੈਬਿਟ ਜੋ ਅਸਲ ਇਨਪੁਟ/ਆਊਟਪੁੱਟ ਟੋਕਨਾਂ ਦੁਆਰਾ ਟੋਕਨ ਬੈਲੰਸ। GPU ਰੈਂਟਲ ਉਹਨਾਂ ਮਸ਼ੀਨਾਂ ਲਈ ਇੱਕ ਐਡ-ਆਨ ਹੈ ਜੋ ਤੁਸੀਂ ਕੰਟਰੋਲ ਕਰਦੇ ਹੋ।

ਕੀ ਵੱਖ-ਵੱਖ ਏਜੰਟ ਵੱਖ-ਵੱਖ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹਨ?

ਹਾਂ—ਹਰੇਕ ਏਜੰਟ ਦਾ ਆਪਣਾ ਡਿਫਾਲਟ ਹੋ ਸਕਦਾ ਹੈ। ਕਾਰਜ ਅਤੇ ਚੈਟ ਗਲੋਬਲ ਡਿਫੌਲਟ ਨੂੰ ਬਦਲੇ ਬਿਨਾਂ ਇੱਕ ਸਿੰਗਲ ਰਨ ਲਈ ਓਵਰਰਾਈਡ ਕਰ ਸਕਦੇ ਹਨ।

ਸੋਨੇਟ ਅਤੇ ਓਪਸ ਵਿੱਚ ਕੀ ਅੰਤਰ ਹੈ?

ਔਪਸ ਨੂੰ ਕਠੋਰ ਤਰਕ ਅਤੇ ਲੰਬੇ ਸੁਮੇਲ ਵਾਲੀਆਂ ਯੋਜਨਾਵਾਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ; ਰੋਜ਼ਾਨਾ ਏਜੰਟ ਲੂਪਸ ਲਈ ਸੋਨੇਟ ਤੇਜ਼ ਅਤੇ ਸਸਤਾ ਹੈ। ਹਾਇਕੂ ਅਤੇ ਫਲੈਸ਼-ਕਲਾਸ ਮਾਡਲ ਵਾਲੀਅਮ ਸਬਟਾਸਕ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਹਨ।

ਕੀ ਮੈਂ ਸਿਰਫ ਆਪਣਾ ਮਾਡਲ ਚਲਾ ਸਕਦਾ ਹਾਂ ਅਤੇ ਕਲਾਉਡ API ਨੂੰ ਬਲੌਕ ਕਰ ਸਕਦਾ ਹਾਂ?

ਐਂਟਰਪ੍ਰਾਈਜ਼ ਵਰਕਸਪੇਸ ਆਊਟਬਾਉਂਡ ਮਾਡਲ ਪ੍ਰਦਾਤਾਵਾਂ ਨੂੰ ਸੀਮਤ ਕਰ ਸਕਦੇ ਹਨ ਅਤੇ ਸਾਰੇ ਏਜੰਟ ਟ੍ਰੈਫਿਕ ਨੂੰ ਤੁਹਾਡੇ GPU ਅੰਤਮ ਬਿੰਦੂ ਤੱਕ ਰੂਟ ਕਰ ਸਕਦੇ ਹਨ। ਹਾਈਬ੍ਰਿਡ ਮੋਡ ਜ਼ਿਆਦਾਤਰ ਟੀਮਾਂ ਲਈ ਡਿਫੌਲਟ ਹੁੰਦਾ ਹੈ।

ਕਿਹੜੇ GPU ਆਕਾਰ ਉਪਲਬਧ ਹਨ?

ਪੇਸ਼ਕਸ਼ਾਂ ਖੇਤਰ ਅਤੇ ਮੰਗ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀਆਂ ਹਨ—ਆਮ ਤੌਰ 'ਤੇ 7B–70B ਕਲਾਸ ਮਾਡਲਾਂ ਲਈ 24–80 GB VRAM ਟੀਅਰ ਅਤੇ ਵੱਡੇ ਸਟੈਕ ਲਈ ਮਲਟੀ-GPU ਨੋਡਸ। ਅਸੀਂ ਤੁਹਾਡੇ ਪੈਰਾਮੀਟਰ ਦੀ ਗਿਣਤੀ ਅਤੇ ਮਾਤਰਾਕਰਨ ਤੋਂ VRAM ਨੂੰ ਆਕਾਰ ਦੇਣ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਾਂ।

ਕੀ ਪ੍ਰਾਈਵੇਟ GPU ਵਰਤੋਂ ਅਜੇ ਵੀ ਡਿਜੀਓ ਟੋਕਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੀ ਹੈ?

ਆਰਕੇਸਟ੍ਰੇਸ਼ਨ (ਏਜੰਟ, ਕੰਮ, ਸਟੋਰੇਜ) ਤੁਹਾਡੀ ਯੋਜਨਾ 'ਤੇ ਰਹਿੰਦਾ ਹੈ। ਤੁਹਾਡੇ GPU 'ਤੇ ਅਨੁਮਾਨ ਨੂੰ GPU ਸਮੇਂ ਵਜੋਂ ਬਿਲ ਕੀਤਾ ਜਾਂਦਾ ਹੈ; ਤੁਸੀਂ ਅੰਦਰੂਨੀ ਚਾਰਜਬੈਕ ਲਈ ਵਿਕਲਪਿਕ ਤੌਰ 'ਤੇ ਟੋਕਨ-ਆਕਾਰ ਦੀ ਵਰਤੋਂ ਨੂੰ ਮੀਟਰ ਕਰ ਸਕਦੇ ਹੋ।

ਪ੍ਰਬੰਧਿਤ ਮਾਡਲ ਚੁਣੋ ਜਾਂ ਆਪਣਾ GPU ਲਿਆਓ

ਅੱਜ ਹੀ ਕਲਾਉਡ ਅਤੇ GPT 'ਤੇ ਸ਼ੁਰੂ ਕਰੋ, ਫਿਰ ਸਮਰਪਿਤ GPU ਸ਼ਾਮਲ ਕਰੋ ਜਦੋਂ ਤੁਸੀਂ ਕਸਟਮ ਵਜ਼ਨ ਦੀ ਮੇਜ਼ਬਾਨੀ ਕਰਨ ਲਈ ਤਿਆਰ ਹੋਵੋ—ਉਹੀ ਏਜੰਟ, ਉਹੀ ਕੰਮ, ਤੁਹਾਡਾ ਅਨੁਮਾਨ।