Do I pay twice—plan plus API?

Your Digio subscription covers infrastructure, agents, and included Digio Tokens. Managed model usage debits that token balance by actual input/output tokens. GPU rental is an add-on for the machines you control.

Can different agents use different models?

Yes—each agent can have its own default. Tasks and chats can override for a single run without changing the global default.

What is the difference between Sonnet and Opus?

Opus is tuned for harder reasoning and longer coherent plans; Sonnet is faster and cheaper for everyday agent loops. Haiku and flash-class models are best for volume subtasks.

Can I run only my own model and block cloud APIs?

Enterprise workspaces can restrict outbound model providers and route all agent traffic to your GPU endpoint. Hybrid mode is the default for most teams.

Which GPU sizes are available?

Offerings depend on region and demand—commonly 24–80 GB VRAM tiers for 7B–70B class models and multi-GPU nodes for larger stacks. We help size VRAM from your parameter count and quantization.

Does private GPU usage still consume Digio Tokens?

Orchestration (agents, tasks, storage) stays on your plan. Inference on your GPU is billed as GPU time; you may optionally meter token-shaped usage for internal chargeback.

ڈیجیو انفراسٹرکچر

AI ماڈلز اور GPU

آج ہی مینیجڈ فرنٹیئر ماڈلز پر ایجنٹس چلائیں — یا GPU کی گنجائش کرایہ پر لیں، اپنا وزن تعینات کریں، اور Digio کے کاموں کو اسی ورک اسپیس میں پرائیویٹ اینڈ پوائنٹس تک لے جائیں۔

کلاڈ، جی پی ٹی، جیمنی۔ فی ایجنٹ ماڈل چنیں۔ GPU رینٹل اور BYOM

کام کی جگہ بنائیں منصوبے اور ٹوکن

منظم ماڈلز

ڈیجیو میں آج ماڈل دستیاب ہیں۔

فی ایجنٹ ایک ڈیفالٹ ماڈل تفویض کریں یا فی کام اوور رائڈ کریں۔ آپ کے پلان بیلنس سے ڈیجیو ٹوکنز میں استعمال کا میٹر کیا جاتا ہے— وہی والیٹ چاہے ایجنٹ سونیٹ، GPT-4o، یا Gemini Flash کو کال کرے۔

انتھروپک کلاڈ

Claude Opus 4.7 فلیگ شپ استدلال، طویل سیاق و سباق، فن تعمیر اور حکمت عملی کا کام۔
Claude Opus 4.6 مستحکم، اعلیٰ معیار کے تجزیہ کے لیے پچھلی نسل کا Opus۔
Claude Sonnet 4.6 روزانہ ڈرائیور—کوڈنگ، تحریر، اور ملٹی سٹیپ ایجنٹ لوپس۔
Claude Sonnet 4.5 / 4 معاون کام کے بوجھ پر فوری کیشنگ کے ساتھ فاسٹ سونیٹ ٹائرز۔
Claude Haiku 4.5 کم تاخیر والے ڈرافٹ، درجہ بندی، اور زیادہ حجم والے ذیلی کام۔

اوپن اے آئی

GPT-5.5 / GPT-5.4 / GPT-5.2 عمومی اور ایجنٹی کام کے بوجھ کے لیے تازہ ترین GPT-5 فیملی۔
GPT-4.1 & GPT-4o پروڈکشن ایجنٹس کے لیے قابل اعتماد ملٹی موڈل چیٹ اور ٹول کا استعمال۔
GPT-4o mini خلاصوں اور ہلکے وزن کے اقدامات کے لیے لاگت سے موثر روٹنگ۔
o3 / o3-pro / o3-mini / o4-mini ریاضی، منصوبہ بندی، اور تصدیق کے لیے استدلال پر مرکوز ماڈلز۔
GPT-5.3 Codex & Codex mini کوڈ جنریشن، ریفیکٹرز، اور ریپو سے آگاہ ایجنٹ کی مہارتیں۔

گوگل جیمنی۔

Gemini 2.5 Pro طویل سیاق و سباق کی تحقیق اور ساختی نکالنا۔
Gemini 2.5 Flash مسابقتی ٹوکن ریٹس کے ساتھ اعلی تھرو پٹ ایجنٹ کے اقدامات۔
Gemini 2.0 Flash پارسنگ، ٹیگنگ اور بیچ جابز کے لیے انتہائی تیز پاسز۔

کھولیں اور ماہر APIs

DeepSeek Chat & Reasoner چیٹ اور چین آف تھیٹ اسٹائل کے کاموں کے لیے مضبوط قدر۔
Mistral Large کثیر لسانی ایجنٹ ٹیموں کے لیے یورپی میزبانی کا اختیار۔
Llama 3.3 70B API کے ذریعے اوپن ویٹ کلاس ماڈل — نجی GPU کے ساتھ اچھی طرح سے جوڑتا ہے۔
Grok 3 خبروں اور سماجی نگرانی کے ایجنٹوں کے لیے حقیقی وقت پر مبنی ماڈل۔
Sonar Pro تحقیقی ایجنٹوں کے لیے بنیاد پر جوابات تلاش کریں۔
Command R+ RAG دوستانہ انٹرپرائز چیٹ اور بازیافت ورک فلوز۔

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

استعمال

ایجنٹ کس طرح ماڈل چنتے ہیں۔

کوآرڈینیٹر سونیٹ بمقابلہ اوپس بمقابلہ ایک سستا فلیش ماڈل ٹاسک کی قسم کی بنیاد پر تجویز کر سکتا ہے۔ پاور یوزرز فی ایجنٹ رول ڈیفالٹ سیٹ کرتے ہیں—سونیٹ پر تحقیق، اوپس پر حتمی جائزہ، ہائیکو یا جیمنی فلیش پر بلک ٹیگنگ۔

Per agent — default model in agent settings; override in To do or chat when needed.
Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).
Skills stay the same — tools and integrations work across models; only latency and cost profile change.
Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU کرایہ پر لینا

GPU کرایہ پر لیں اور اپنے ماڈل چلائیں۔

ایک ٹھیک دھن، ایک ایئر گیپڈ چوکی، یا متوقع تخمینہ قیمت کی ضرورت ہے؟ اپنے Digio ورک اسپیس میں وقف GPU کی گنجائش شامل کریں، اپنی پسند کا سرونگ اسٹیک انسٹال کریں، اور اپنے پرائیویٹ اینڈ پوائنٹ پر ایجنٹس کو پوائنٹ کریں۔

وقف شدہ مثالیں۔

فی گھنٹہ یا ماہانہ GPU نوڈس (A100, H100, L40S کلاس) جو آپ کے کرایہ دار سے منسلک ہیں— دوسرے صارفین سے الگ تھلگ۔

آپ کا وزن

سیفٹینسرز، جی جی یو ایف اپ لوڈ کریں، یا اپنی رجسٹری سے کھینچیں۔ Llama، Mistral، Qwen، اور حسب ضرورت فائن ٹونز چلائیں۔

معیاری سرونگ

vLLM، TGI، Ollama، یا کنٹینر امیجز جنہیں آپ برقرار رکھتے ہیں—Digio ایجنٹس OpenAI-مطابقت پذیر بیس URL کو کال کرتے ہیں۔

ایک ہی آرکیسٹریشن

کرنے کے لیے، ٹیم چیٹ، مہارتیں، اور تعاون میں کوئی تبدیلی نہیں کی گئی—صرف انفرنس بیک اینڈ آپ کا ہے۔

ہائبرڈ روٹنگ

حساس اقدامات نجی GPU کو بھیجیں اور ایک ورک فلو میں عوامی تحقیق کے لیے Claude یا GPT استعمال کریں۔

انٹرپرائز کنٹرولز

وی پی سی پیئرنگ، سٹیٹک ایگریس، آڈٹ لاگز، اور ریگولیٹڈ ٹیموں کے لیے ماڈل کی اجازت دینے والی فہرستیں۔

اپنا ماڈل لائیں۔

اپنی مرضی کے مطابق ماڈل انسٹال اور منسلک کریں۔

آپ کے اختتامی نقطہ کو کال کرنے والے ایجنٹوں تک صفر سے لے کر عام سیٹ اپ:

GPU محفوظ کریں۔

VRAM، علاقہ، اور اپ ٹائم (برسٹ بمقابلہ ہمیشہ آن) کا انتخاب کریں۔ مثال کے ساتھ بحری جہازوں کے لیے ذخیرہ یا آپ کی بالٹی کو ماؤنٹ کریں۔
اسٹیک کو تعینات کریں۔

سرونگ امیج یا SSH ان میں شروع کریں، CUDA ڈرائیورز انسٹال کریں، اور چیک پوائنٹس لوڈ کریں۔ صحت کی جانچ اس بات کی تصدیق کرتی ہے کہ ماڈل تیار ہے۔
اختتامی نقطہ رجسٹر کریں۔

ورک اسپیس سیٹنگز میں بیس یو آر ایل، API کلید اور ماڈل آئی ڈی شامل کریں۔ Digio لائیو جانے سے پہلے لیٹنسی اور ٹوکن فارمیٹ کی توثیق کرتا ہے۔
ایجنٹوں کو تفویض کریں۔

منتخب ایجنٹوں کے لیے اپنے نجی ماڈل کو بطور ڈیفالٹ منتخب کریں۔ منظم کلاڈ/جی پی ٹی ماڈل ساتھ ساتھ دستیاب رہتے ہیں۔

GPU رینٹل کا بل Digio پلان کی سبسکرپشنز سے الگ کیا جاتا ہے۔ صلاحیت کی منصوبہ بندی، SLAs، اور موجودہ انفرنس کلسٹر سے ہجرت کے لیے ہم سے رابطہ کریں۔

اکثر پوچھے گئے سوالات

ماڈلز اور GPU سوالات

Digio پر منظم APIs بمقابلہ خود میزبانی کا انتخاب کرنا۔

کیا میں دو بار ادا کرتا ہوں — پلان پلس API؟

آپ کے Digio سبسکرپشن میں انفراسٹرکچر، ایجنٹس، اور Digio ٹوکنز شامل ہیں۔ منیجڈ ماڈل کے استعمال کے ڈیبٹ جو اصل ان پٹ/آؤٹ پٹ ٹوکنز کے ذریعہ بیلنس کو ٹوکن کرتے ہیں۔ GPU رینٹل ان مشینوں کے لیے ایک اضافہ ہے جن کو آپ کنٹرول کرتے ہیں۔

کیا مختلف ایجنٹ مختلف ماڈل استعمال کر سکتے ہیں؟

ہاں—ہر ایجنٹ کا اپنا ڈیفالٹ ہو سکتا ہے۔ ٹاسکس اور چیٹس عالمی ڈیفالٹ کو تبدیل کیے بغیر ایک ہی رن کے لیے اوور رائیڈ کر سکتے ہیں۔

سونیٹ اور اوپس میں کیا فرق ہے؟

اوپس کو سخت استدلال اور طویل مربوط منصوبوں کے لیے بنایا گیا ہے۔ روزمرہ کے ایجنٹ لوپس کے لیے سونیٹ تیز اور سستا ہے۔ ہائیکو اور فلیش کلاس ماڈل والیوم سب ٹاسک کے لیے بہترین ہیں۔

کیا میں صرف اپنا ماڈل چلا سکتا ہوں اور کلاؤڈ APIs کو روک سکتا ہوں؟

انٹرپرائز ورک اسپیس آؤٹ باؤنڈ ماڈل فراہم کنندگان کو محدود کر سکتے ہیں اور تمام ایجنٹ ٹریفک کو آپ کے GPU اینڈ پوائنٹ پر روٹ کر سکتے ہیں۔ زیادہ تر ٹیموں کے لیے ہائبرڈ موڈ ڈیفالٹ ہے۔

کون سے GPU سائز دستیاب ہیں؟

پیشکشیں علاقے اور طلب پر منحصر ہوتی ہیں — 7B–70B کلاس ماڈلز کے لیے عام طور پر 24–80 GB VRAM درجے اور بڑے اسٹیک کے لیے ملٹی-GPU نوڈس۔ ہم آپ کے پیرامیٹر کی گنتی اور کوانٹائزیشن سے سائز VRAM میں مدد کرتے ہیں۔

کیا نجی GPU استعمال اب بھی Digio Tokens استعمال کرتا ہے؟

آرکیسٹریشن (ایجنٹ، کام، اسٹوریج) آپ کے منصوبے پر قائم رہتا ہے۔ آپ کے GPU پر تخمینہ GPU وقت کے طور پر بل کیا جاتا ہے۔ آپ اندرونی چارج بیک کے لیے اختیاری طور پر ٹوکن کے سائز کے استعمال کو میٹر لگا سکتے ہیں۔

Digio کو دریافت کریں۔

ماڈلز کو کام پر لگائیں۔

ایجنٹ، کام، اور مہارتیں - آپ کے منتخب کردہ ماڈل کے ارد گرد کام کی جگہ۔

منظم ماڈلز کا انتخاب کریں یا اپنا GPU لائیں۔

کلاؤڈ اور جی پی ٹی پر آج ہی شروع کریں، پھر جب آپ حسب ضرورت وزن کی میزبانی کرنے کے لیے تیار ہوں تو سرشار GPU شامل کریں — وہی ایجنٹ، وہی کام، آپ کا اندازہ۔

شروع کریں منصوبوں کا موازنہ کریں۔